TMS320C55X中的反正切实现

html5 • 2022年9月13日 pm5:03 • 问答

我正在学习 TMS320C55x 中的反正切实现，这是源代码：


;* AR0   assigned to _x
;* AR1   assigned to _r
;* T0   assigned to _nx
        PSH     T3
     || BSET    FRCT            ;fractional mode
    SUB #1, T0          ;nx-1
    MOV T0, BRC0        ;repeat nx times
        MOV     #2596 << #16, AC3       ; AC3.Hi = C5
        MOV #-9464 << #16, AC1  ; AC1.Hi = C3
    MOV #32617 << #16, AC2  ; AC2.Hi = C1
*
* Note: loading T3 on the instruction before a multiply that uses it will
* cause a 1-cycle delay.
*
    MPYMR   T3=*AR0+, AC3, AC0      ; (Prime the Pump)
    
     || RPTBLOCAL   loop1-1
            MACR    AC0, T3, AC1, AC0
            MPYR    T3, AC0
          ||MOV *AR0+, T1               ; (for next iteration)
            MACR    AC0, T3, AC2, AC0
            MPYR    T3, AC0
              ||MOV T1, T3
            MOV HI(AC0), *AR1+      ;save result
          ||MPYR    T1, AC3, AC0            ; (for next iteration)
loop1:

        POP     T3
     || BCLR    FRCT            ;return to standard C
    MOV #0, T0          ;return OK value (no possible error)
     || RET

其中 _x 是输入向量，_r 是输出向量。nx 是元素的数量。问题是关于分配给 AC3、AC1、AC2 的常量。我想这是多项式近似的系数，但我不明白如何计算它们

回答

我不遵循汇编代码，但我可以猜出这些魔术系数来自哪里。

意见建议的代码C1，C3，C5是一个多项式近似的系数，arctan是奇函数，所以它的泰勒展开周围0有确实只有奇权力x。与泰勒展开式中的相比C1 = 32617，1在y = x - 1/3 x^3 + 1/5 x^5 - 1/7 x^7 + ...给定计算上下文的情况下，这进一步表明计算结果按缩放2^15 = 32768。

事实证明，这y = (32617 x - 9464 x^3 + 2596 x^5) / 32768实际上是arctan(x)区间上的一个很好的近似值[-1, 1]。如下所示（在wolfram alpha 中验证）近似值的最大绝对误差小于1/1000，并且在x = ±1对应于的端点处可以忽略不计y = ±?/4，这在图形计算中可能是可取的。

至于系数是如何实际导出的，仅使用 9 个控制点的粗略多项式最佳拟合给出了y = 32613 x - 9443 x^3 + 2573 x^5系数已经接近发布代码中使用的系数的多项式。更多的控制点和/或额外的条件来最小化终点处的误差会导致系数略有不同，但是如果没有任何关于实际使用的优化标准的文档或线索，很难猜测如何准确匹配代码中的那些.

以上是TMS320C55X中的反正切实现的全部内容。

THE END

二维码

tasklet_action()函数中为什么会调用BUG？

< <上一篇

有没有办法让操作系统在CPAN发行版中定义依赖项？

下一篇>>

搜索内容

TMS320C55X中的反正切实现

回答

目录

目录

推荐文章

最新文章