问题对于非寄存器大小的操作数，shl和shr的行为是什么？

这个问题的灵感来自我尝试回答另一个问题：将十进制/整数转换为二进制 - 它的工作方式和原理如何？

唯一的文件对于我可以找到的按位移位运算符说：

操作x shl y和x shr y将x的值向左或向右移位y位，其中（如果x是无符号整数）等于x乘以或除以2 ^ y;结果与x的类型相同。例如，如果N存储值01101（十进制13），则N shl 1返回11010（十进制26）。请注意，y的值以x的类型的大小为基础进行解释。因此，例如，如果x是整数，则x shl 40被解释为x sh18，因为整数是32位而40 mod 32是8。

考虑这个程序：

{$APPTYPE CONSOLE}
program BitwiseShift;
var
  u8: Byte;
  u16: Word;
  u32: LongWord;
  u64: UInt64;
begin
  u8 := $ff;
  Writeln((u8 shl 7) shr 7);
  // expects: 1 actual: 255

  u16 := $ffff;
  Writeln((u16 shl 15) shr 15);
  // expects: 1 actual: 65535

  u32 := $ffffffff;
  Writeln((u32 shl 31) shr 31);
  // expects: 1 actual: 1

  u64 := $ffffffffffffffff;
  Writeln((u64 shl 63) shr 63);
  // expects: 1 actual: 1
end.

对于32位和64位Windows编译器，我使用XE3和XE5运行它，并且输出是一致的，如上面的代码中所述。

我期望 (u8 shl 7) shr 7 将完全在8位类型的上下文中进行评估。因此，当位移位超出该8位类型的末尾时，这些位将丢失。

我的问题是为什么程序的行为与它一样。

有趣的是，我将程序翻译成C ++，并在我的64位mingw 4.6.3上获得了相同的输出。

#include <cstdint>
#include <iostream>

int main()
{
    uint8_t u8 = 0xff;
    std::cout << ((u8 << 7) >> 7) << std::endl;

    uint16_t u16 = 0xffff;
    std::cout << ((u16 << 15) >> 15) << std::endl;

    uint32_t u32 = 0xffffffff;
    std::cout << ((u32 << 31) >> 31) << std::endl;

    uint64_t u64 = 0xffffffffffffffff;
    std::cout << ((u64 << 63) >> 63) << std::endl;
}

12503

2018-01-26 10:49

起源

我刚用TP55进行了测试，结果相似（寄存器大小为16而不是32）。所以我想按位操作默认使用（最大）寄存器大小变量。 - LU RD

为什么不直接问Embarcadero？他们应该给你正确的答案 - RBA

@rba我对此表示怀疑 - David Heffernan

从Delphi 3手册中了解Integer类型： Any byte-sized operand is converted to an intermediate word-sized operand that is compatible with both Smallint and Word before any arithmetic operation is performed. - LU RD

@LURD根据文档中的分类，这些是按位运算而不是算术运算： docwiki.embarcadero.com/RADStudio/XE5/Expressions_(Delphi） - David Heffernan

答案:

原因是类型促销：

隐式类型转换的一个特例是类型提升，其中编译器自动扩展二进制表示整数或浮点类型的对象。促销通常是用于小于目标平台的本机类型的类型 ALU在算术和逻辑运算之前为了做到这一点如果ALU可以使用更多，则可以进行操作，或者更高效比一种类型。 C和C ++对对象执行此类提升布尔值，字符，宽字符，枚举和短整数提升为int的类型，以及float类型的对象被提升为双倍。与其他类型的转换，促销不同永远不会丢失精度或修改存储在对象中的值。

所以在下面的代码中

var
  u8: Byte;

begin
  u8 := $ff;
  Writeln((u8 shl 7) shr 7);
..

该 u8 之前将值提升为32值 shl;要修复结果，您需要显式类型转换：

  Writeln(Byte(u8 shl 7) shr 7);

C ++标准，第4.5节整体促销：

char类型的rvalue，signed char，unsigned char，short int或如果int可以表示，unsigned short int可以转换为int类型的rvalue 源类型的所有值;否则，源rvalue可以转换为unsigned int类型的右值。

要检查Delphi是否遵循类型提升中的相同约定，我编写了以下应用程序：

var
  u8: Byte;
  u16: Word;
  u32: LongWord;

procedure Test(Value: Integer); overload;
begin
  Writeln('Integer');
end;

procedure Test(Value: Cardinal); overload;
begin
  Writeln('Cardinal');
end;

begin
  u8 := $ff;
  Test(u8);     // 'Integer'
  u16 := $ffff;
  Test(u16);    // 'Integer'
  u32 := $ffffffff;
  Test(u32);    // 'Cardinal'
  Readln;
end.

所以我相信Delphi和C ++之间应该没有区别。

2018-01-26 12:56

你知道Delphi文档是否描述了这些规则吗？ - David Heffernan

不，这是你应该学习C ++来理解Delphi的情况。 - kludg

这对我有什么帮助？很明显，我可以看到发生了什么。我真的在寻找一些文档。 - David Heffernan

所以我相信Delphi和C ++之间应该没有区别。 C ++标准没有定义Delphi语言。 - David Heffernan

我修改了你的测试

procedure TestByte;
var
  u8 : Byte;
  LShift : Integer;
begin
  Writeln( 'Byte' );
  u8 := $FF;
  LShift := 7;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 15;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 31;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 63;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
end;

procedure TestWord;
var
  u8 : Word;
  LShift : Integer;
begin
  Writeln( 'Word' );
  u8 := $FF;
  LShift := 7;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 15;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 31;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 63;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
end;

procedure TestLongWord;
var
  u8 : LongWord;
  LShift : Integer;
begin
  Writeln( 'LongWord' );
  u8 := $FF;
  LShift := 7;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 15;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 31;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 63;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
end;

procedure TestUInt64;
var
  u8 : UInt64;
  LShift : Integer;
begin
  Writeln( 'UInt64' );
  u8 := $FF;
  LShift := 7;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 15;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 31;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
  LShift := 63;
  Writeln( IntToHex( u8, 16 ), '-', LShift : 2, ' ', IntToHex( u8 shl LShift, 16 ), ' ', IntToHex( ( u8 shl LShift ) shr LShift, 16 ) );
end;

begin
  TestByte;
  TestWord;
  TestLongWord;
  TestUInt64;
end.

它给了我这个结果

字节
00000000000000FF- 7 0000000000007F80 00000000000000FF
00000000000000FF-15 00000000007F8000 00000000000000FF
00000000000000FF-31 000000008000 0000000000000001
00000000000000FF-63 000000008000 0000000000000001
字
00000000000000FF- 7 0000000000007F80 00000000000000FF
00000000000000FF-15 00000000007F8000 00000000000000FF
00000000000000FF-31 000000008000 0000000000000001
00000000000000FF-63 000000008000 0000000000000001
长字
00000000000000FF- 7 0000000000007F80 00000000000000FF
00000000000000FF-15 00000000007F8000 00000000000000FF
00000000000000FF-31 000000008000 0000000000000001
00000000000000FF-63 000000008000 0000000000000001
答：64
00000000000000FF- 7 0000000000007F80 00000000000000FF
00000000000000FF-15 00000000007F8000 00000000000000FF
00000000000000FF-31 0000007F80000000 00000000000000FF
00000000000000FF-63 八千万亿 0000000000000001

因此，在内部，值不会在声明它们的类型中处理

2018-01-26 11:43

问题中的代码表明它们不是以声明的类型处理的。除32/64位整数外，还有特殊待遇。看起来好像底层的ISA被反映回语言。 - David Heffernan

@DavidHeffernan我猜 u8 : byte; u8 := $ff; u8 := u8 shl 7; u8 := u8 shr 7; 应该有预期的结果 - Sir Rufo

确实。或者更紧凑 ((u8 shl 7) and $ff) shr 7。 - David Heffernan

幕后发生的事实上非常有趣。

鉴于以下Delphi应用程序：

program BitwiseShift;
var
  u8: Byte;
begin
  //all in one go
  u8 := $ff;
  Writeln((u8 shl 7) shr 7);   
  // expects: 1 actual: 255

  //step by step
  u8 := $ff;
  u8:= u8 shl 7;
  u8:= u8 shr 7;
  WriteLn(u8);  
  // expects: 1 actual: 1
end.

生成以下组件（在XE2中）

BitwiseShift.dpr.10: Writeln((u8 shl 7) shr 7);
004060D3 33D2             xor edx,edx
004060D5 8A1594AB4000     mov dl,[$0040ab94]
004060DB C1E207           shl edx,$07
004060DE C1EA07           shr edx,$07
004060E1 A114784000       mov eax,[$00407814]  <<--- The result is NOT a byte!!
004060E6 E895D6FFFF       call @Write0Long
004060EB E864D9FFFF       call @WriteLn
004060F0 E8A7CCFFFF       call @_IOTest
BitwiseShift.dpr.13: u8 := $ff;
004060F5 C60594AB4000FF   mov byte ptr [$0040ab94],$ff
BitwiseShift.dpr.14: u8:= u8 shl 7;
004060FC C02594AB400007   shl byte ptr [$0040ab94],$07
BitwiseShift.dpr.15: u8:= u8 shr 7;
00406103 33C0             xor eax,eax
00406105 A094AB4000       mov al,[$0040ab94]
0040610A C1E807           shr eax,$07
0040610D A294AB4000       mov [$0040ab94],al
BitwiseShift.dpr.16: WriteLn(u8);
00406112 33D2             xor edx,edx
00406114 8A1594AB4000     mov dl,[$0040ab94]
0040611A A114784000       mov eax,[$00407814]
0040611F E85CD6FFFF       call @Write0Long
00406124 E82BD9FFFF       call @WriteLn
00406129 E86ECCFFFF       call @_IOTest

据我所知，规则是：

规则

正在执行的移位的狭窄程度（8/16/32位）取决于的大小结果转变，而不是变量的大小用于轮班。在原始情况下，您不保留变量保持结果，因此Delphi选择默认（整数）您。

如何获得预期的结果
在我改变的情况下，结果是字节大小的，因此数据被切割成该大小。

如果您改变您的情况以强制使用字节，则满足您的原始期望：

Writeln(byte(byte(u8 shl 7) shr 7));
// expects: 1 actual: 1

Project24.dpr.19: Writeln(byte(byte(u8 shl 7) shr 7));
00406135 8A1594AB4000     mov dl,[$0040ab94]
0040613B C1E207           shl edx,$07
0040613E 81E2FF000000     and edx,$000000ff
00406144 C1EA07           shr edx,$07
00406147 81E2FF000000     and edx,$000000ff
0040614D A114784000       mov eax,[$00407814]
00406152 E829D6FFFF       call @Write0Long
00406157 E8F8D8FFFF       call @WriteLn
0040615C E83BCCFFFF       call @_IOTest

2018-01-27 21:02

问题 对于非寄存器大小的操作数，shl和shr的行为是什么？

答案:

热门问题

问题对于非寄存器大小的操作数，shl和shr的行为是什么？