ROCm
diff --git a/‎llvm/lib/Target/AMDGPU/AMDGPU.td
-3 b/‎llvm/lib/Target/AMDGPU/AMDGPU.td
-3
diff --git a/‎llvm/lib/Target/AMDGPU/AMDGPUSubtarget.cpp
+8 b/‎llvm/lib/Target/AMDGPU/AMDGPUSubtarget.cpp
+8
diff --git a/‎llvm/lib/Target/AMDGPU/AsmParser/AMDGPUAsmParser.cpp
+9 b/‎llvm/lib/Target/AMDGPU/AsmParser/AMDGPUAsmParser.cpp
+9
diff --git a/‎llvm/lib/Target/AMDGPU/Disassembler/AMDGPUDisassembler.cpp
+18-2 b/‎llvm/lib/Target/AMDGPU/Disassembler/AMDGPUDisassembler.cpp
+18-2
diff --git a/‎llvm/test/CodeGen/AMDGPU/insert-waitcnts-crash.ll
+147-147 b/‎llvm/test/CodeGen/AMDGPU/insert-waitcnts-crash.ll
+147-147
diff --git a/‎llvm/test/CodeGen/AMDGPU/llvm.amdgcn.wavefrontsize.ll
+8-8 b/‎llvm/test/CodeGen/AMDGPU/llvm.amdgcn.wavefrontsize.ll
+8-8
diff --git a/‎llvm/test/CodeGen/AMDGPU/pei-amdgpu-cs-chain-preserve.mir
+4-4 b/‎llvm/test/CodeGen/AMDGPU/pei-amdgpu-cs-chain-preserve.mir
+4-4
diff --git a/‎llvm/test/CodeGen/AMDGPU/pei-amdgpu-cs-chain.mir
+9-9 b/‎llvm/test/CodeGen/AMDGPU/pei-amdgpu-cs-chain.mir
+9-9
@@ -1382,7 +1382,6 @@ def FeatureISAVersion10_Common : FeatureSet<
    FeatureLDSBankCount32,
    FeatureDLInsts,
    FeatureNSAEncoding,
-   FeatureWavefrontSize32,
    FeatureBackOffBarrier]>;
 
 def FeatureISAVersion10_1_Common : FeatureSet<
@@ -1466,7 +1465,6 @@ def FeatureISAVersion11_Common : FeatureSet<
    FeatureDot10Insts,
    FeatureNSAEncoding,
    FeaturePartialNSAEncoding,
-   FeatureWavefrontSize32,
    FeatureShaderCyclesRegister,
    FeatureArchitectedFlatScratch,
    FeatureAtomicFaddRtnInsts,
@@ -1539,7 +1537,6 @@ def FeatureISAVersion12 : FeatureSet<
    FeatureDot10Insts,
    FeatureNSAEncoding,
    FeaturePartialNSAEncoding,
-   FeatureWavefrontSize32,
    FeatureShaderCyclesHiLoRegisters,
    FeatureArchitectedFlatScratch,
    FeatureArchitectedSGPRs,
 
@@ -104,6 +104,14 @@ GCNSubtarget::initializeSubtargetDependencies(const Triple &TT,
                                         : AMDGPUSubtarget::SOUTHERN_ISLANDS;
   }
 
+  if (!hasFeature(AMDGPU::FeatureWavefrontSize32) &&
+      !hasFeature(AMDGPU::FeatureWavefrontSize64)) {
+    // If there is no default wave size it must be a generation before gfx10,
+    // these have FeatureWavefrontSize64 in their definition already. For gfx10+
+    // set wave32 as a default.
+    ToggleFeature(AMDGPU::FeatureWavefrontSize32);
+  }
+
   // We don't support FP64 for EG/NI atm.
   assert(!hasFP64() || (getGeneration() >= AMDGPUSubtarget::SOUTHERN_ISLANDS));
 
 
@@ -1398,6 +1398,15 @@ class AMDGPUAsmParser : public MCTargetAsmParser {
       copySTI().ToggleFeature("southern-islands");
     }
 
+    FeatureBitset FB = getFeatureBits();
+    if (!FB[AMDGPU::FeatureWavefrontSize64] &&
+        !FB[AMDGPU::FeatureWavefrontSize32]) {
+      // If there is no default wave size it must be a generation before gfx10,
+      // these have FeatureWavefrontSize64 in their definition already. For
+      // gfx10+ set wave32 as a default.
+      copySTI().ToggleFeature(AMDGPU::FeatureWavefrontSize32);
+    }
+
     setAvailableFeatures(ComputeAvailableFeatures(getFeatureBits()));
 
     {
 
@@ -44,10 +44,26 @@ using namespace llvm;
 
 using DecodeStatus = llvm::MCDisassembler::DecodeStatus;
 
+static const MCSubtargetInfo &addDefaultWaveSize(const MCSubtargetInfo &STI,
+                                                 MCContext &Ctx) {
+  if (!STI.hasFeature(AMDGPU::FeatureWavefrontSize64) &&
+      !STI.hasFeature(AMDGPU::FeatureWavefrontSize32)) {
+    MCSubtargetInfo &STICopy = Ctx.getSubtargetCopy(STI);
+    // If there is no default wave size it must be a generation before gfx10,
+    // these have FeatureWavefrontSize64 in their definition already. For gfx10+
+    // set wave32 as a default.
+    STICopy.ToggleFeature(AMDGPU::FeatureWavefrontSize32);
+    return STICopy;
+  }
+
+  return STI;
+}
+
 AMDGPUDisassembler::AMDGPUDisassembler(const MCSubtargetInfo &STI,
                                        MCContext &Ctx, MCInstrInfo const *MCII)
-    : MCDisassembler(STI, Ctx), MCII(MCII), MRI(*Ctx.getRegisterInfo()),
-      MAI(*Ctx.getAsmInfo()), TargetMaxInstBytes(MAI.getMaxInstLength(&STI)) {
+    : MCDisassembler(addDefaultWaveSize(STI, Ctx), Ctx), MCII(MCII),
+      MRI(*Ctx.getRegisterInfo()), MAI(*Ctx.getAsmInfo()),
+      TargetMaxInstBytes(MAI.getMaxInstLength(&STI)) {
   // ToDo: AMDGPUDisassembler supports only VI ISA.
   if (!STI.hasFeature(AMDGPU::FeatureGCN3Encoding) && !isGFX10Plus())
     report_fatal_error("Disassembly not yet supported for subtarget");
 
@@ -1,19 +1,19 @@
 ; RUN: llc -mtriple=amdgcn -mcpu=fiji -verify-machineinstrs < %s | FileCheck -check-prefixes=GCN,W64 %s
-; RUN: llc -mtriple=amdgcn -mcpu=gfx1010 -mattr=+wavefrontsize32,-wavefrontsize64 -verify-machineinstrs < %s | FileCheck -check-prefixes=GCN,W32 %s
-; RUN: llc -mtriple=amdgcn -mcpu=gfx1010 -mattr=-wavefrontsize32,+wavefrontsize64 -verify-machineinstrs < %s | FileCheck -check-prefixes=GCN,W64 %s
-; RUN: llc -mtriple=amdgcn -mcpu=gfx1100 -mattr=+wavefrontsize32,-wavefrontsize64 -verify-machineinstrs -amdgpu-enable-vopd=0 < %s | FileCheck -check-prefixes=GCN,W32 %s
-; RUN: llc -mtriple=amdgcn -mcpu=gfx1100 -mattr=-wavefrontsize32,+wavefrontsize64 -verify-machineinstrs < %s | FileCheck -check-prefixes=GCN,W64 %s
+; RUN: llc -mtriple=amdgcn -mcpu=gfx1010 -mattr=+wavefrontsize32 -verify-machineinstrs < %s | FileCheck -check-prefixes=GCN,W32 %s
+; RUN: llc -mtriple=amdgcn -mcpu=gfx1010 -mattr=+wavefrontsize64 -verify-machineinstrs < %s | FileCheck -check-prefixes=GCN,W64 %s
+; RUN: llc -mtriple=amdgcn -mcpu=gfx1100 -mattr=+wavefrontsize32 -verify-machineinstrs -amdgpu-enable-vopd=0 < %s | FileCheck -check-prefixes=GCN,W32 %s
+; RUN: llc -mtriple=amdgcn -mcpu=gfx1100 -mattr=+wavefrontsize64 -verify-machineinstrs < %s | FileCheck -check-prefixes=GCN,W64 %s
 
 ; RUN: opt -O3 -S < %s | FileCheck -check-prefix=OPT %s
 ; RUN: opt -mtriple=amdgcn-- -O3 -S < %s | FileCheck -check-prefix=OPT %s
 ; RUN: opt -mtriple=amdgcn-- -O3 -mattr=+wavefrontsize32 -S < %s | FileCheck -check-prefix=OPT %s
 ; RUN: opt -mtriple=amdgcn-- -passes='default<O3>' -mattr=+wavefrontsize32 -S < %s | FileCheck -check-prefix=OPT %s
 ; RUN: opt -mtriple=amdgcn-- -O3 -mattr=+wavefrontsize64 -S < %s | FileCheck -check-prefix=OPT %s
 ; RUN: opt -mtriple=amdgcn-- -mcpu=tonga -O3 -S < %s | FileCheck -check-prefix=OPT %s
-; RUN: opt -mtriple=amdgcn-- -mcpu=gfx1010 -O3 -mattr=+wavefrontsize32,-wavefrontsize64 -S < %s | FileCheck -check-prefix=OPT %s
-; RUN: opt -mtriple=amdgcn-- -mcpu=gfx1010 -O3 -mattr=-wavefrontsize32,+wavefrontsize64 -S < %s | FileCheck -check-prefix=OPT %s
-; RUN: opt -mtriple=amdgcn-- -mcpu=gfx1100 -O3 -mattr=+wavefrontsize32,-wavefrontsize64 -S < %s | FileCheck -check-prefix=OPT %s
-; RUN: opt -mtriple=amdgcn-- -mcpu=gfx1100 -O3 -mattr=-wavefrontsize32,+wavefrontsize64 -S < %s | FileCheck -check-prefix=OPT %s
+; RUN: opt -mtriple=amdgcn-- -mcpu=gfx1010 -O3 -mattr=+wavefrontsize32 -S < %s | FileCheck -check-prefix=OPT %s
+; RUN: opt -mtriple=amdgcn-- -mcpu=gfx1010 -O3 -mattr=+wavefrontsize64 -S < %s | FileCheck -check-prefix=OPT %s
+; RUN: opt -mtriple=amdgcn-- -mcpu=gfx1100 -O3 -mattr=+wavefrontsize32 -S < %s | FileCheck -check-prefix=OPT %s
+; RUN: opt -mtriple=amdgcn-- -mcpu=gfx1100 -O3 -mattr=+wavefrontsize64 -S < %s | FileCheck -check-prefix=OPT %s
 
 ; GCN-LABEL: {{^}}fold_wavefrontsize:
 ; OPT-LABEL: define amdgpu_kernel void @fold_wavefrontsize(
 
@@ -145,7 +145,7 @@ body:             |
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $sgpr104_lo16
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $sgpr105_lo16
     ; GCN-NEXT: SCRATCH_STORE_DWORD_ST killed $vgpr10, 4, 0, implicit $exec, implicit $flat_scr :: (store (s32) into %stack.0, addrspace 5)
-    ; GCN-NEXT: frame-setup CFI_INSTRUCTION llvm_vector_offset <badreg>, 32, $exec_lo_lo16, 32, 128
+    ; GCN-NEXT: frame-setup CFI_INSTRUCTION llvm_vector_offset $vgpr10_lo16, 32, $exec_lo_lo16, 32, 128
     ; GCN-NEXT: renamable $vgpr10 = V_MOV_B32_e32 10, implicit $exec
     ; GCN-NEXT: $vgpr8 = COPY killed renamable $vgpr10
     ; GCN-NEXT: renamable $sgpr4_sgpr5 = SI_PC_ADD_REL_OFFSET target-flags(amdgpu-gotprel32-lo) @callee + 4, target-flags(amdgpu-gotprel32-hi) @callee + 12, implicit-def dead $scc
@@ -180,7 +180,7 @@ body:             |
     ; GCN-NEXT: {{  $}}
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION escape 0x0f, 0x09, 0x90, 0x40, 0x94, 0x04, 0x35, 0x24, 0x36, 0xe9, 0x02
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION llvm_register_pair $pc_reg, $sgpr30_lo16, 32, $sgpr31_lo16, 32
-    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined <badreg>
+    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $vgpr0_lo16
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $sgpr0_lo16
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $sgpr1_lo16
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $sgpr2_lo16
@@ -641,8 +641,8 @@ body:             |
     ; GCN-NEXT: {{  $}}
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION escape 0x0f, 0x09, 0x90, 0x40, 0x94, 0x04, 0x35, 0x24, 0x36, 0xe9, 0x02
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION llvm_register_pair $pc_reg, $sgpr30_lo16, 32, $sgpr31_lo16, 32
-    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined <badreg>
-    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined <badreg>
+    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $vgpr0_lo16
+    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $vgpr7_lo16
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $sgpr0_lo16
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $sgpr1_lo16
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $sgpr2_lo16
 
@@ -173,8 +173,8 @@ body:             |
     ; GCN-NEXT: {{  $}}
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION escape 0x0f, 0x09, 0x90, 0x40, 0x94, 0x04, 0x35, 0x24, 0x36, 0xe9, 0x02
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION llvm_register_pair $pc_reg, $sgpr30_lo16, 32, $sgpr31_lo16, 32
-    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined <badreg>
-    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined <badreg>
+    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $vgpr8_lo16
+    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $vgpr9_lo16
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $sgpr0_lo16
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $sgpr1_lo16
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $sgpr2_lo16
@@ -325,7 +325,7 @@ body:             |
     ; GCN-NEXT: {{  $}}
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION escape 0x0f, 0x09, 0x90, 0x40, 0x94, 0x04, 0x35, 0x24, 0x36, 0xe9, 0x02
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION llvm_register_pair $pc_reg, $sgpr30_lo16, 32, $sgpr31_lo16, 32
-    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined <badreg>
+    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $vgpr8_lo16
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $sgpr35_lo16
     ; GCN-NEXT: $vgpr8 = SI_SPILL_S32_TO_VGPR $sgpr35, 0, killed $vgpr8
     ; GCN-NEXT: $sgpr35 = S_MOV_B32 5
@@ -357,8 +357,8 @@ body:             |
     ; GCN-NEXT: {{  $}}
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION escape 0x0f, 0x09, 0x90, 0x40, 0x94, 0x04, 0x35, 0x24, 0x36, 0xe9, 0x02
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION llvm_register_pair $pc_reg, $sgpr30_lo16, 32, $sgpr31_lo16, 32
-    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined <badreg>
-    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined <badreg>
+    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $vgpr8_lo16
+    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $vgpr16_lo16
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $sgpr0_lo16
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $sgpr1_lo16
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $sgpr2_lo16
@@ -498,10 +498,10 @@ body:             |
     ; GCN-NEXT: {{  $}}
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION escape 0x0f, 0x09, 0x90, 0x40, 0x94, 0x04, 0x35, 0x24, 0x36, 0xe9, 0x02
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION llvm_register_pair $pc_reg, $sgpr30_lo16, 32, $sgpr31_lo16, 32
-    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined <badreg>
-    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined <badreg>
-    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined <badreg>
-    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined <badreg>
+    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $vgpr0_lo16
+    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $vgpr7_lo16
+    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $vgpr8_lo16
+    ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $vgpr9_lo16
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $sgpr0_lo16
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $sgpr1_lo16
     ; GCN-NEXT: frame-setup CFI_INSTRUCTION undefined $sgpr2_lo16
Original file line number	Diff line number	Diff line change
`@@ -1398,6 +1398,15 @@ class AMDGPUAsmParser : public MCTargetAsmParser {`
`1398`	`1398`	`copySTI().ToggleFeature("southern-islands");`
`1399`	`1399`	`}`
`1400`	`1400`
	`1401`	`+ FeatureBitset FB = getFeatureBits();`
	`1402`	`+ if (!FB[AMDGPU::FeatureWavefrontSize64] &&`
	`1403`	`+ !FB[AMDGPU::FeatureWavefrontSize32]) {`
	`1404`	`+ // If there is no default wave size it must be a generation before gfx10,`
	`1405`	`+ // these have FeatureWavefrontSize64 in their definition already. For`
	`1406`	`+ // gfx10+ set wave32 as a default.`
	`1407`	`+ copySTI().ToggleFeature(AMDGPU::FeatureWavefrontSize32);`
	`1408`	`+ }`
	`1409`	`+`
`1401`	`1410`	`setAvailableFeatures(ComputeAvailableFeatures(getFeatureBits()));`
`1402`	`1411`
`1403`	`1412`	`{`