C嵌入式程序集错误:“ asm”操作数具有不可能的约束

Jiankang Liu

当我用C语言嵌入程序集时,在ubuntu linux 14.04中使用shell命令编译这些代码时遇到以下错误。

    IFR_temp_measure.cpp: In function ‘void BlockTempClc(char*, char*, 
     int, int, char, int, int, int, int*, int, int*, int)’:
     IFR_temp_measure.cpp:1843:6: error: ‘asm’ operand has impossible 
    constraints);
    ^
    &make: *** [IFR_temp_measure.o] Error 1

或错误代码行1842,1843的位置响应该代码

    :"cc", "memory","q0", "q1", "q2", "q3", "q4", "q5", "q6", "q7", "q8", "q10", "q11", "q12", "q13", "q14", "q15","r0", "r1", "r3", "r4", "r5","r6","r8", "r9", "r10", "r12"
            );

我已经尝试解决此问题,但是网上几乎没有参考资料,但有一个链接器:Gcc内联汇编“'asm'操作数具有不可能的约束”是什么意思?http://www.ethernut.de/en/documents/arm-inline-asm.html,但没有帮助。我的代码如下:

    void BlockTempClc(char* src1,char* src2,int StrideDist,int height,char temp_comp1,int numofiterations,int temp_comp2,int temp_comp3,int *dstData,int width,int *dstSum,int step)
{

            volatile char array1[16] = {0,0,0,0,0,0,0,0,
                                       0,0,0,0,0,0,0,0};
            volatile char array2[16] = {0,0,1,0,2,0,3,0,
                                       4,0,5,0,6,0,7,0};
            asm volatile(   
            "mov        r0, %0; " //image[0]    
            "mov        r1, %1; "  //image[1] 
            "mov        r12,%11; " //m
            "mov        r3, %4; " //n
            "mov        r4, %2; " //store data
            "mov        r8, %12; " //step down for loading next line of image
            "mov        r5, %6; " //numofiterations
            "mov        r6, %3; " //out

            "mov.8 r9,%5;"//isp_temp_comp
            "mov.8 r10,%7;"//led_temp_comp
            "mov.8 r11,%8;"//fac_temp_comp


            "vdup.8 d20,r9;"//copy arm register value isp_temp_comp to neon  register
            "VMOV.S16 q9, d20; " //isp_temp_comp transfer to signed short type

            "VLD1.8     {d16,d17}, [%9];"//q8  array1 sum
            "VLD1.8     {d6,d7}, [%10];"//q3  array2

            "VMOV.S16   q0, #256; "
            "VMOV.S16   q1, #2730; " //Assign immediate number 2730 to each 16 bits of d1       

            ".loop:;"           

            "vdup.8 d21,r10;"//copy arm register value led_temp_comp to neon  register 
            "vdup.8 d22,r11;"//copy arm register value fac_temp_comp to neon  register 

            "VLD1.8    d14, [r1],r8; "    // q7  *(image[1] + tmp + n)  Load: Load Picture Pixels   r6:move step  ?
            "VLD1.8    d15, [r0],r8 "    // *(image[0] + tmp + n)  Load: Load Picture Pixels            

            "PLD        [r1]; " //Preload: one line in cache
            "PLD        [r0]; "  //?

            "VMOV.S16  q5, d14; " //q5    8*16  transfer to signed short type:*(image[1] + tmp + n) 
            "VMOV.S16  q6, d15; " //q6    8*16  transfer to signed short type : *(image[0] + tmp + n) 

            "VADD.S16  q12,q6, q9;"//*(image[0] + tmp + n) + isp_temp_comp              
            "VMOV.S16  q6, d21; " //led_temp_comp
            "VADD.S16  q13,q12, q6;"//*(image[0] + tmp + n) + isp_temp_comp+ + led_temp_comp
            "VMOV.S16  q6, d22; " //fac_temp_comp
            "VADD.S16  q14,q13, q6;"//*(image[0] + tmp + n) + isp_temp_comp+ + led_temp_comp+ fac_temp_comp
            "VSUB.S16  q15,q14, q1;"//*(image[0] + tmp + n) + isp_temp_comp+ + led_temp_comp+ fac_temp_comp-2730
            "VMLA.S16   q15, q5, q0;"//img_temp[m][n]=*(image[0] + tmp + n) + isp_temp_comp+ + led_temp_comp+ fac_temp_comp-2730+*(image[1] + tmp + n) *256 


            "VADD.S16  q2,q15, q8;"//sum                
            "VMOV.S16    q8, q2; " //q8


            "vdup.8 d20,r3;"//n 
            "vdup.8 d21,r12;"//m

            "VMOV.S16  q11, d20; " //n
            "VMOV.S16  q10, d21; " //m

            "VADD.S16  q4,q3, q11;"//(n,n+1,n+2,n+3,n+4,n+5,n+6,n+7)
            "VADD.S16  q7,q3, q10;"//(m,m+1,m+2,m+3,m+4,m+5,m+6,m+7)  q7


            "VST1.16     {d30[0]}, [r4]!; "//restore img_temp[m][n] to pointer data
            "VST1.16     {d14[0]}, [r4]!; "//restore m
            "VST1.16     {d8[0]}, [r4]!; "  //restore n

            "VST1.16     {d30[1]}, [r4]!; "     
            "VST1.16     {d14[1]}, [r4]!; "
            "VST1.16     {d8[1]}, [r4]!; "

            "VST1.16     {d30[2]}, [r4]!; "     
            "VST1.16     {d14[2]}, [r4]!; "
            "VST1.16     {d8[2]}, [r4]!; "

            "VST1.16     {d30[3]}, [r4]!; "     
            "VST1.16     {d14[3]}, [r4]!; "
            "VST1.16     {d8[3]}, [r4]!; "//response to array

            "subs        r5, r5, #1; "   // decrement: numofinteration -= 1;
            "bne        .loop; "        // Branch If Not Zero; to .loop
            "VST1.16     {d4[0]}, [r6]!; "//q2 refer to sum restore the final result to pointer out
            "VST1.16     {d4[1]}, [r6]!; "
            "VST1.16     {d4[2]}, [r6]!; "
            "VST1.16     {d4[3]}, [r6]!; "
            "VST1.16     {d5[0]}, [r6]!; "
            "VST1.16     {d5[1]}, [r6]!; "
            "VST1.16     {d5[2]}, [r6]!; "
            "VST1.16     {d5[3]}, [r6]!; "

            :"+r"(src1),"+r"(src2),"+r"(dstData),"+r"(dstSum),"+r"(height)
            :"r"(temp_comp1),"r"(numofiterations),"r"(temp_comp2),"r"(temp_comp3),
                "r"(array1),"r"(array2), "r"(width),"r"(step)
            :"cc", "memory","q0", "q1", "q2", "q3", "q4", "q5", "q6", "q7", "q8", "q10", "q11", "q12", "q13", "q14", "q15","r0", "r1", "r3", "r4", "r5","r6","r8", "r9", "r10", "r12"
            );
}

我想这个问题可能是输出操作数列表或输出操作数列表。是什么导致我的代码错误?如何解决?

彼得·科德斯

您在大多数整数寄存器上声明了clobbers,但随后又请求了13个不同的输入变量。32位ARM仅具有16个寄存器,其中2个是PC和SP,最多只有14个真正的通用寄存器。

我们可以通过删除r0.. r12;上的所有Clobbers来测试是否有太多Clobbers +操作数是问题这样就可以编译(编译成错误的代码!)。https://godbolt.org/z/Z6x78N不是解决方案,因为它引入了巨大的错误,这就是我确认这是问题所在的方式。

每当您的内联asm模板mov以从输入寄存器操作数复制到硬编码寄存器开始时,通常就做错了。即使您有足够的寄存器,编译器也将不得不发出代码以将变量放入寄存器,然后您的手写asm会mov无缘无故地使用另一个来复制它。

有关更多指南,请参见https://stackoverflow.com/tags/inline-assembly/info

而是首先使用要求编译器输入该寄存器中的输入register int foo asm("r0"),或者最好让编译器通过使用%0或等效的命名操作数%[src1]进行寄存器分配而不是r0在asm模板中的所有位置进行硬编码命名操作数的语法为[name] "r" (C_var_name)他们不具备相匹配,但他们不必是唯一的要么; 使用与C var名称相同的asm操作数名称通常很方便。

然后,您可以删除大多数GP寄存器上的垃圾桶。您确实需要告诉编译器您要修改的任何输入寄存器,例如通过使用"+r"约束代替"r"(然后在asm修改之后不使用该C变量)。或者使用"=r"输出约束和匹配的输入约束(例如"0" (var),将该输入与输出操作数0放在同一寄存器中)"+r"在包装函数中变得更加容易,在该函数中无论如何以后都不会使用C变量。

如果使用伪输出操作数来使编译器进行寄存器分配,则可以删除矢量寄存器上的修饰符,但是如果只保留那些硬编码,则基本上可以。

asm(  // "mov        r0, %[src1]; "   // remove this and just use %[src1] instead of r0

      "... \n\t"
      "VST1.16     {d30[0]}, [%[dstData]]!   \n\t"  //restore img_temp[m][n] to pointer data
      "... \n\t"

    : [src1]"+&r"(src1), [src2]"+&r"(src2), [dstData]"+&r"(dstData),
      [dstSum]"+&r"(dstSum), [height]"+&r"(height)

    : [temp_comp1] "r"(temp_comp1),  [niter] "r"(numofiterations),
      [temp_comp2] "r"(temp_comp2), [temp_comp3] "r"(temp_comp3),
      ...
    : "memory", "cc", all the q and d regs you use.  // but not r0..r13
   );

您可以查看编译器的asm输出,以查看它如何填充给您的asm模板中的%0%[name]操作数。使用"instruction \n\t"使其可读,;将所有指令放在asm输出的同一行上。(C字符串文字级联不会引入换行符)。

读/写操作数上的早期指令声明确保即使仅编译器知道,仅输入操作数也不与它们共享寄存器temp_comp1 == height因为temp_comp1仍然需要从寄存器中读取的原始值%[temp_comp1],即使在某些修改之后%[height]因此,两者不能都一样r4否则,如果没有&in "+&r"则仅在读取所有输入之后才写入输出,编译器可以选择该选项以提高效率。(例如,在包装一条指令时,例如GNU C内联asm旨在高效执行)。


旁注:char array1[16]和2不必是volatile"memory"对汇编语句撞就足够了,即使你只是传递指向他们,而不是将它们用作"m"输入操作数。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

Gcc内联汇编“'asm'操作数具有不可能的约束”是什么意思?

asm错误:具有多个输入操作数的“操作符类型与'rol'不匹配”

C#不能跨程序集边界使用,因为它具有作为嵌入式互操作类型的通用类型参数

将类型从嵌入式互操作类型公开到其他程序集

不能跨程序集边界使用,因为它具有作为嵌入式互操作类型的通用类型参数

带有嵌入式sql的程序给出了编译错误

编写内联x86_64程序集时,内联asm约束'i'的操作数无效

android ndk asm编译错误:“ asm”中的操作数约束不一致

具有独立应用程序的嵌入式Linux

嵌入式C中的驱动程序和库有什么区别

MongoDB C#驱动程序-更新嵌入式文档数组中的所有字段

Linux汇编器错误“'asm'中不可能约束”

将所有程序集放在一起并将其用作exe中的嵌入式资源

Hibernate Search中具有嵌入式索引的程序化映射导致无法找到字段错误

具有嵌入式ID的实体的带有Spring Boot DDL查询错误的Wix嵌入式mysql

无效的“asm”:操作数不是条件代码,无效的操作数代码“c”

C ++ / ASM-“操作数大小冲突”,“操作数类型不正确”

如何调试带有 500 错误的嵌入式 javascript

错误:无效的“asm”:%-字母后缺少操作数编号

ASM:操作数大小不匹配,出现“输出”错误

Chrome扩展程序:拒绝执行嵌入式脚本,但是没有嵌入式脚本吗?

具有单个应用程序的TomEE嵌入式/捆绑式

不可能的隐式移动操作?

错误:“->”的基本操作数具有非指针类型“ JNIEnv”

错误: ? 的操作数:具有不同类型的“int”和“std::basic_ostream<char>”

创建类数组时,->的基本操作数具有非指针类型错误

致命错误:不再支持具有非恒定操作数的'continue'运算符

错误:“->”的基操作数具有非指针类型“const”

Symfony 3:类属性上带有约束的嵌入式表格错误消息