问题 对于非寄存器大小的操作数,shl和shr的行为是什么?


这个问题的灵感来自我尝试回答另一个问题: 将十进制/整数转换为二进制 - 它的工作方式和原理如何?

唯一的 文件 对于我可以找到的按位移位运算符说:

操作x shl y和x shr y将x的值向左或向右移位y位,其中(如果x是无符号整数)等于x乘以或除以2 ^ y;结果与x的类型相同。例如,如果N存储值01101(十进制13),则N shl 1返回11010(十进制26)。请注意,y的值以x的类型的大小为基础进行解释。因此,例如,如果x是整数,则x shl 40被解释为x sh18,因为整数是32位而40 mod 32是8。

考虑这个程序:

{$APPTYPE CONSOLE}
program BitwiseShift;
var
  u8: Byte;
  u16: Word;
  u32: LongWord;
  u64: UInt64;
begin
  u8 := $ff;
  Writeln((u8 shl 7) shr 7);
  // expects: 1 actual: 255

  u16 := $ffff;
  Writeln((u16 shl 15) shr 15);
  // expects: 1 actual: 65535

  u32 := $ffffffff;
  Writeln((u32 shl 31) shr 31);
  // expects: 1 actual: 1

  u64 := $ffffffffffffffff;
  Writeln((u64 shl 63) shr 63);
  // expects: 1 actual: 1
end.

对于32位和64位Windows编译器,我使用XE3和XE5运行它,并且输出是一致的,如上面的代码中所述。

我期望 (u8 shl 7) shr 7 将完全在8位类型的上下文中进行评估。因此,当位移位超出该8位类型的末尾时,这些位将丢失。

我的问题是为什么程序的行为与它一样。


有趣的是,我将程序翻译成C ++,并在我的64位mingw 4.6.3上获得了相同的输出。

#include <cstdint>
#include <iostream>

int main()
{
    uint8_t u8 = 0xff;
    std::cout << ((u8 << 7) >> 7) << std::endl;

    uint16_t u16 = 0xffff;
    std::cout << ((u16 << 15) >> 15) << std::endl;

    uint32_t u32 = 0xffffffff;
    std::cout << ((u32 << 31) >> 31) << std::endl;

    uint64_t u64 = 0xffffffffffffffff;
    std::cout << ((u64 << 63) >> 63) << std::endl;
}

12503
2018-01-26 10:49


起源

我刚用TP55进行了测试,结果相似(寄存器大小为16而不是32)。所以我想按位操作默认使用(最大)寄存器大小变量。 - LU RD
为什么不直接问Embarcadero?他们应该给你正确的答案 - RBA
@rba我对此表示怀疑 - David Heffernan
从Delphi 3手册中了解Integer类型: Any byte-sized operand is converted to an intermediate word-sized operand that is compatible with both Smallint and Word before any arithmetic operation is performed. - LU RD
@LURD根据文档中的分类,这些是按位运算而不是算术运算: docwiki.embarcadero.com/RADStudio/XE5/Expressions_(Delphi) - David Heffernan


答案:


原因是 类型促销

隐式类型转换的一个特例是类型提升,其中   编译器自动扩展二进制表示   整数或浮点类型的对象。促销通常是   用于小于目标平台的本机类型的类型   ALU在算术和逻辑运算之前为了做到这一点   如果ALU可以使用更多,则可以进行操作,或者更高效   比一种类型。 C和C ++对对象执行此类提升   布尔值,字符,宽字符,枚举和短整数   提升为int的类型,以及float类型的对象   被提升为双倍。与其他类型的转换,促销不同   永远不会丢失精度或修改存储在对象中的值。

所以在下面的代码中

var
  u8: Byte;

begin
  u8 := $ff;
  Writeln((u8 shl 7) shr 7);
..

u8 之前将值提升为32值 shl;要修复结果,您需要显式类型转换:

  Writeln(Byte(u8 shl 7) shr 7);

C ++标准,第4.5节整体促销:

char类型的rvalue,signed char,unsigned char,short int或   如果int可以表示,unsigned short int可以转换为int类型的rvalue   源类型的所有值;否则,源rvalue可以   转换为unsigned int类型的右值。


要检查Delphi是否遵循类型提升中的相同约定,我编写了以下应用程序:

var
  u8: Byte;
  u16: Word;
  u32: LongWord;

procedure Test(Value: Integer); overload;
begin
  Writeln('Integer');
end;

procedure Test(Value: Cardinal); overload;
begin
  Writeln('Cardinal');
end;

begin
  u8 := $ff;
  Test(u8);     // 'Integer'
  u16 := $ffff;
  Test(u16);    // 'Integer'
  u32 := $ffffffff;
  Test(u32);    // 'Cardinal'
  Readln;
end.

所以我相信Delphi和C ++之间应该没有区别。


10
2018-01-26 12:56



你知道Delphi文档是否描述了这些规则吗? - David Heffernan
不,这是你应该学习C ++来理解Delphi的情况。 - kludg
这对我有什么帮助?很明显,我可以看到发生了什么。我真的在寻找一些文档。 - David Heffernan
所以我相信Delphi和C ++之间应该没有区别。 C ++标准没有定义Delphi语言。 - David Heffernan


我修改了你的测试

procedure TestByte;
var
  u8 : Byte;
  LShift : Integer;
begin
  Writeln( 'Byte' );
  u8 := $FF;
  LShift := 7;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 15;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 31;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 63;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
end;

procedure TestWord;
var
  u8 : Word;
  LShift : Integer;
begin
  Writeln( 'Word' );
  u8 := $FF;
  LShift := 7;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 15;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 31;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 63;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
end;

procedure TestLongWord;
var
  u8 : LongWord;
  LShift : Integer;
begin
  Writeln( 'LongWord' );
  u8 := $FF;
  LShift := 7;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 15;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 31;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 63;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
end;

procedure TestUInt64;
var
  u8 : UInt64;
  LShift : Integer;
begin
  Writeln( 'UInt64' );
  u8 := $FF;
  LShift := 7;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 15;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 31;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 63;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
end;

begin
  TestByte;
  TestWord;
  TestLongWord;
  TestUInt64;
end.

它给了我这个结果

字节
00000000000000FF- 7 0000000000007F80 00000000000000FF
00000000000000FF-15 00000000007F8000 00000000000000FF
00000000000000FF-31 000000008000 0000000000000001
00000000000000FF-63 000000008000 0000000000000001
字
00000000000000FF- 7 0000000000007F80 00000000000000FF
00000000000000FF-15 00000000007F8000 00000000000000FF
00000000000000FF-31 000000008000 0000000000000001
00000000000000FF-63 000000008000 0000000000000001
长字
00000000000000FF- 7 0000000000007F80 00000000000000FF
00000000000000FF-15 00000000007F8000 00000000000000FF
00000000000000FF-31 000000008000 0000000000000001
00000000000000FF-63 000000008000 0000000000000001
答:64
00000000000000FF- 7 0000000000007F80 00000000000000FF
00000000000000FF-15 00000000007F8000 00000000000000FF
00000000000000FF-31 0000007F80000000 00000000000000FF
00000000000000FF-63 八千万亿 0000000000000001

因此,在内部,值不会在声明它们的类型中处理


4
2018-01-26 11:43



问题中的代码表明它们不是以声明的类型处理的。除32/64位整数外,还有特殊待遇。看起来好像底层的ISA被反映回语言。 - David Heffernan
@DavidHeffernan我猜 u8 : byte; u8 := $ff; u8 := u8 shl 7; u8 := u8 shr 7; 应该有预期的结果 - Sir Rufo
确实。或者更紧凑 ((u8 shl 7) and $ff) shr 7。 - David Heffernan


幕后发生的事实上非常有趣。

鉴于以下Delphi应用程序:

program BitwiseShift;
var
  u8: Byte;
begin
  //all in one go
  u8 := $ff;
  Writeln((u8 shl 7) shr 7);   
  // expects: 1 actual: 255

  //step by step
  u8 := $ff;
  u8:= u8 shl 7;
  u8:= u8 shr 7;
  WriteLn(u8);  
  // expects: 1 actual: 1
end.

生成以下组件(在XE2中)

BitwiseShift.dpr.10: Writeln((u8 shl 7) shr 7);
004060D3 33D2             xor edx,edx
004060D5 8A1594AB4000     mov dl,[$0040ab94]
004060DB C1E207           shl edx,$07
004060DE C1EA07           shr edx,$07
004060E1 A114784000       mov eax,[$00407814]  <<--- The result is NOT a byte!!
004060E6 E895D6FFFF       call @Write0Long
004060EB E864D9FFFF       call @WriteLn
004060F0 E8A7CCFFFF       call @_IOTest
BitwiseShift.dpr.13: u8 := $ff;
004060F5 C60594AB4000FF   mov byte ptr [$0040ab94],$ff
BitwiseShift.dpr.14: u8:= u8 shl 7;
004060FC C02594AB400007   shl byte ptr [$0040ab94],$07
BitwiseShift.dpr.15: u8:= u8 shr 7;
00406103 33C0             xor eax,eax
00406105 A094AB4000       mov al,[$0040ab94]
0040610A C1E807           shr eax,$07
0040610D A294AB4000       mov [$0040ab94],al
BitwiseShift.dpr.16: WriteLn(u8);
00406112 33D2             xor edx,edx
00406114 8A1594AB4000     mov dl,[$0040ab94]
0040611A A114784000       mov eax,[$00407814]
0040611F E85CD6FFFF       call @Write0Long
00406124 E82BD9FFFF       call @WriteLn
00406129 E86ECCFFFF       call @_IOTest

据我所知,规则是:

规则 

正在执行的移位的狭窄程度(8/16/32位)取决于   的大小 结果 转变,而不是变量的大小   用于轮班。在原始情况下,您不保留变量   保持结果,因此Delphi选择默认(整数)   您。

如何获得预期的结果
在我改变的情况下,结果是字节大小的,因此数据被切割成该大小。

如果您改变您的情况以强制使用字节,则满足您的原始期望:

Writeln(byte(byte(u8 shl 7) shr 7));
// expects: 1 actual: 1

Project24.dpr.19: Writeln(byte(byte(u8 shl 7) shr 7));
00406135 8A1594AB4000     mov dl,[$0040ab94]
0040613B C1E207           shl edx,$07
0040613E 81E2FF000000     and edx,$000000ff
00406144 C1EA07           shr edx,$07
00406147 81E2FF000000     and edx,$000000ff
0040614D A114784000       mov eax,[$00407814]
00406152 E829D6FFFF       call @Write0Long
00406157 E8F8D8FFFF       call @WriteLn
0040615C E83BCCFFFF       call @_IOTest

2
2018-01-27 21:02