<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
{font-family:"Cambria Math";
panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
{font-family:Calibri;
panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
{margin:0in;
margin-bottom:.0001pt;
font-size:11.0pt;
font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
{mso-style-priority:99;
color:#0563C1;
text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
{mso-style-priority:99;
color:#954F72;
text-decoration:underline;}
span.EmailStyle17
{mso-style-type:personal-compose;
font-family:"Calibri",sans-serif;
color:windowtext;}
.MsoChpDefault
{mso-style-type:export-only;
font-family:"Calibri",sans-serif;}
@page WordSection1
{size:8.5in 11.0in;
margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
{page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="#0563C1" vlink="#954F72">
<div class="WordSection1">
<p class="MsoNormal">The changes in the workarounds function use DRM_INFO rather than DRM_DEBUG because CZs with EDC are often used in embedded environments and any info can be useful especially in the case of an intermittent problem.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">From e1ce383592c275b58ad95bd80b5479af8c1f9dae Mon Sep 17 00:00:00 2001<o:p></o:p></p>
<p class="MsoNormal">From: David Panariti <David.Panariti@amd.com><o:p></o:p></p>
<p class="MsoNormal">Date: Fri, 14 Apr 2017 13:41:52 -0400<o:p></o:p></p>
<p class="MsoNormal">Subject: [PATCH 1/3] drm/amdgpu: Moved gfx_v8_0_select_se_sh() in lieu of<o:p></o:p></p>
<p class="MsoNormal">re-redundant prototype.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Will be needed for the rest of the EDC workarounds patch.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Change-Id: Ie586ab38a69e98a91c6cb5747e285ce8bfdd1c86<o:p></o:p></p>
<p class="MsoNormal">Signed-off-by: David Panariti <David.Panariti@amd.com><o:p></o:p></p>
<p class="MsoNormal">---<o:p></o:p></p>
<p class="MsoNormal">drivers/gpu/drm/amd/amdgpu/gfx_v8_0.c | 46 +++++++++++++++++------------------<o:p></o:p></p>
<p class="MsoNormal">1 file changed, 23 insertions(+), 23 deletions(-)<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">diff --git a/drivers/gpu/drm/amd/amdgpu/gfx_v8_0.c b/drivers/gpu/drm/amd/amdgpu/gfx_v8_0.c<o:p></o:p></p>
<p class="MsoNormal">index 2ff5f19..27b57cb 100644<o:p></o:p></p>
<p class="MsoNormal">--- a/drivers/gpu/drm/amd/amdgpu/gfx_v8_0.c<o:p></o:p></p>
<p class="MsoNormal">+++ b/drivers/gpu/drm/amd/amdgpu/gfx_v8_0.c<o:p></o:p></p>
<p class="MsoNormal">@@ -1500,6 +1500,29 @@ static int gfx_v8_0_kiq_init(struct amdgpu_device *adev)<o:p></o:p></p>
<p class="MsoNormal"> return 0;<o:p></o:p></p>
<p class="MsoNormal">}<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">+static void gfx_v8_0_select_se_sh(struct amdgpu_device *adev,<o:p></o:p></p>
<p class="MsoNormal">+ u32 se_num, u32 sh_num, u32 instance)<o:p></o:p></p>
<p class="MsoNormal">+{<o:p></o:p></p>
<p class="MsoNormal">+ u32 data;<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+ if (instance == 0xffffffff)<o:p></o:p></p>
<p class="MsoNormal">+ data = REG_SET_FIELD(0, GRBM_GFX_INDEX, INSTANCE_BROADCAST_WRITES, 1);<o:p></o:p></p>
<p class="MsoNormal">+ else<o:p></o:p></p>
<p class="MsoNormal">+ data = REG_SET_FIELD(0, GRBM_GFX_INDEX, INSTANCE_INDEX, instance);<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+ if (se_num == 0xffffffff)<o:p></o:p></p>
<p class="MsoNormal">+ data = REG_SET_FIELD(data, GRBM_GFX_INDEX, SE_BROADCAST_WRITES, 1);<o:p></o:p></p>
<p class="MsoNormal">+ else<o:p></o:p></p>
<p class="MsoNormal">+ data = REG_SET_FIELD(data, GRBM_GFX_INDEX, SE_INDEX, se_num);<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+ if (sh_num == 0xffffffff)<o:p></o:p></p>
<p class="MsoNormal">+ data = REG_SET_FIELD(data, GRBM_GFX_INDEX, SH_BROADCAST_WRITES, 1);<o:p></o:p></p>
<p class="MsoNormal">+ else<o:p></o:p></p>
<p class="MsoNormal">+ data = REG_SET_FIELD(data, GRBM_GFX_INDEX, SH_INDEX, sh_num);<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+ WREG32(mmGRBM_GFX_INDEX, data);<o:p></o:p></p>
<p class="MsoNormal">+}<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">static const u32 vgpr_init_compute_shader[] =<o:p></o:p></p>
<p class="MsoNormal">{<o:p></o:p></p>
<p class="MsoNormal"> 0x7e000209, 0x7e020208,<o:p></o:p></p>
<p class="MsoNormal">@@ -3556,29 +3579,6 @@ static void gfx_v8_0_tiling_mode_table_init(struct amdgpu_device *adev)<o:p></o:p></p>
<p class="MsoNormal"> }<o:p></o:p></p>
<p class="MsoNormal">}<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">-static void gfx_v8_0_select_se_sh(struct amdgpu_device *adev,<o:p></o:p></p>
<p class="MsoNormal">- u32 se_num, u32 sh_num, u32 instance)<o:p></o:p></p>
<p class="MsoNormal">-{<o:p></o:p></p>
<p class="MsoNormal">- u32 data;<o:p></o:p></p>
<p class="MsoNormal">-<o:p></o:p></p>
<p class="MsoNormal">- if (instance == 0xffffffff)<o:p></o:p></p>
<p class="MsoNormal">- data = REG_SET_FIELD(0, GRBM_GFX_INDEX, INSTANCE_BROADCAST_WRITES, 1);<o:p></o:p></p>
<p class="MsoNormal">- else<o:p></o:p></p>
<p class="MsoNormal">- data = REG_SET_FIELD(0, GRBM_GFX_INDEX, INSTANCE_INDEX, instance);<o:p></o:p></p>
<p class="MsoNormal">-<o:p></o:p></p>
<p class="MsoNormal">- if (se_num == 0xffffffff)<o:p></o:p></p>
<p class="MsoNormal">- data = REG_SET_FIELD(data, GRBM_GFX_INDEX, SE_BROADCAST_WRITES, 1);<o:p></o:p></p>
<p class="MsoNormal">- else<o:p></o:p></p>
<p class="MsoNormal">- data = REG_SET_FIELD(data, GRBM_GFX_INDEX, SE_INDEX, se_num);<o:p></o:p></p>
<p class="MsoNormal">-<o:p></o:p></p>
<p class="MsoNormal">- if (sh_num == 0xffffffff)<o:p></o:p></p>
<p class="MsoNormal">- data = REG_SET_FIELD(data, GRBM_GFX_INDEX, SH_BROADCAST_WRITES, 1);<o:p></o:p></p>
<p class="MsoNormal">- else<o:p></o:p></p>
<p class="MsoNormal">- data = REG_SET_FIELD(data, GRBM_GFX_INDEX, SH_INDEX, sh_num);<o:p></o:p></p>
<p class="MsoNormal">-<o:p></o:p></p>
<p class="MsoNormal">- WREG32(mmGRBM_GFX_INDEX, data);<o:p></o:p></p>
<p class="MsoNormal">-}<o:p></o:p></p>
<p class="MsoNormal">-<o:p></o:p></p>
<p class="MsoNormal">static u32 gfx_v8_0_create_bitmask(u32 bit_width)<o:p></o:p></p>
<p class="MsoNormal">{<o:p></o:p></p>
<p class="MsoNormal"> return (u32)((1ULL << bit_width) - 1);<o:p></o:p></p>
<p class="MsoNormal">-- <o:p></o:p></p>
<p class="MsoNormal">2.7.4<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">From 38fac8cab73dbc07e0ee7599b52106bc09dd32ea Mon Sep 17 00:00:00 2001<o:p></o:p></p>
<p class="MsoNormal">From: David Panariti <David.Panariti@amd.com><o:p></o:p></p>
<p class="MsoNormal">Date: Mon, 24 Apr 2017 11:05:45 -0400<o:p></o:p></p>
<p class="MsoNormal">Subject: [PATCH 2/3] drm/amdgpu: Complete Carrizo EDC (Error Detection and<o:p></o:p></p>
<p class="MsoNormal">Correction) workarounds.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">The workarounds are unconditionally performed on CZs with EDC enabled.<o:p></o:p></p>
<p class="MsoNormal">EDC detects uncorrected ECC errors and uses data poisoning to prevent<o:p></o:p></p>
<p class="MsoNormal">corrupted compute results from being used (read).<o:p></o:p></p>
<p class="MsoNormal">EDC enabled CZs are often used in embedded environments.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Change-Id: I84c261785329beeb797f11efbe0ec35790f2996c<o:p></o:p></p>
<p class="MsoNormal">Signed-off-by: David Panariti <David.Panariti@amd.com><o:p></o:p></p>
<p class="MsoNormal">---<o:p></o:p></p>
<p class="MsoNormal">drivers/gpu/drm/amd/amdgpu/gfx_v8_0.c | 148 ++++++++++++++++++++++++----------<o:p></o:p></p>
<p class="MsoNormal">1 file changed, 106 insertions(+), 42 deletions(-)<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">diff --git a/drivers/gpu/drm/amd/amdgpu/gfx_v8_0.c b/drivers/gpu/drm/amd/amdgpu/gfx_v8_0.c<o:p></o:p></p>
<p class="MsoNormal">index 27b57cb..2f5bf5f 100644<o:p></o:p></p>
<p class="MsoNormal">--- a/drivers/gpu/drm/amd/amdgpu/gfx_v8_0.c<o:p></o:p></p>
<p class="MsoNormal">+++ b/drivers/gpu/drm/amd/amdgpu/gfx_v8_0.c<o:p></o:p></p>
<p class="MsoNormal">@@ -1645,35 +1645,92 @@ static const u32 sgpr2_init_regs[] =<o:p></o:p></p>
<p class="MsoNormal"> mmCOMPUTE_USER_DATA_9, 0xedcedc09,<o:p></o:p></p>
<p class="MsoNormal">};<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">-static const u32 sec_ded_counter_registers[] =<o:p></o:p></p>
<p class="MsoNormal">-{<o:p></o:p></p>
<p class="MsoNormal">- mmCPC_EDC_ATC_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmCPC_EDC_SCRATCH_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmCPC_EDC_UCODE_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmCPF_EDC_ATC_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmCPF_EDC_ROQ_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmCPF_EDC_TAG_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmCPG_EDC_ATC_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmCPG_EDC_DMA_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmCPG_EDC_TAG_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmDC_EDC_CSINVOC_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmDC_EDC_RESTORE_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmDC_EDC_STATE_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmGDS_EDC_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmGDS_EDC_GRBM_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmGDS_EDC_OA_DED,<o:p></o:p></p>
<p class="MsoNormal">- mmSPI_EDC_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmSQC_ATC_EDC_GATCL1_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmSQC_EDC_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmSQ_EDC_DED_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmSQ_EDC_INFO,<o:p></o:p></p>
<p class="MsoNormal">- mmSQ_EDC_SEC_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmTCC_EDC_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmTCP_ATC_EDC_GATCL1_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmTCP_EDC_CNT,<o:p></o:p></p>
<p class="MsoNormal">- mmTD_EDC_CNT<o:p></o:p></p>
<p class="MsoNormal">+struct reg32_counter_name_map {<o:p></o:p></p>
<p class="MsoNormal">+ uint32_t rnmap_addr; /* Counter register address */<o:p></o:p></p>
<p class="MsoNormal">+ const char *rnmap_name; /* Name of the counter */<o:p></o:p></p>
<p class="MsoNormal">+ size_t rnmap_num_instances; /* Number of block instances */<o:p></o:p></p>
<p class="MsoNormal">};<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">+#define DEF_mmREG32_NAME_MAP_ELEMENT(reg, num_instances) { \<o:p></o:p></p>
<p class="MsoNormal">+ .rnmap_addr = mm##reg, \<o:p></o:p></p>
<p class="MsoNormal">+ .rnmap_name = #reg, \<o:p></o:p></p>
<p class="MsoNormal">+ .rnmap_num_instances = num_instances \<o:p></o:p></p>
<p class="MsoNormal">+}<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+/* See GRBM_GFX_INDEX, et. al. registers. */<o:p></o:p></p>
<p class="MsoNormal">+static const struct reg32_counter_name_map sec_ded_counter_registers[] = {<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(SQC_EDC_CNT, 2),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(SQC_ATC_EDC_GATCL1_CNT, 2),<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(SQ_EDC_SEC_CNT, 8),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(SQ_EDC_DED_CNT, 8),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(TCP_EDC_CNT, 8),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(TCP_ATC_EDC_GATCL1_CNT, 8),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(TD_EDC_CNT, 8),<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(TCC_EDC_CNT, 4),<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(CPC_EDC_ATC_CNT, 1),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(CPC_EDC_SCRATCH_CNT, 1),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(CPC_EDC_UCODE_CNT, 1),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(CPF_EDC_ATC_CNT, 1),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(CPF_EDC_ROQ_CNT, 1),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(CPF_EDC_TAG_CNT, 1),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(CPG_EDC_ATC_CNT, 1),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(CPG_EDC_DMA_CNT, 1),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(CPG_EDC_TAG_CNT, 1),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(DC_EDC_CSINVOC_CNT, 1),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(DC_EDC_STATE_CNT, 1),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(DC_EDC_RESTORE_CNT, 1),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(GDS_EDC_CNT, 1),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(GDS_EDC_GRBM_CNT, 1),<o:p></o:p></p>
<p class="MsoNormal">+ DEF_mmREG32_NAME_MAP_ELEMENT(SPI_EDC_CNT, 1),<o:p></o:p></p>
<p class="MsoNormal">+};<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+static int gfx_v8_0_edc_clear_counters(struct amdgpu_device *adev)<o:p></o:p></p>
<p class="MsoNormal">+{<o:p></o:p></p>
<p class="MsoNormal">+ int ci, se, sh, i;<o:p></o:p></p>
<p class="MsoNormal">+ uint32_t count;<o:p></o:p></p>
<p class="MsoNormal">+ int r = 0;<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+ mutex_lock(&adev->grbm_idx_mutex);<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+ for (ci = 0; ci < ARRAY_SIZE(sec_ded_counter_registers); ++ci) {<o:p></o:p></p>
<p class="MsoNormal">+ const struct reg32_counter_name_map *cp =<o:p></o:p></p>
<p class="MsoNormal">+ sec_ded_counter_registers + ci;<o:p></o:p></p>
<p class="MsoNormal">+ const char *name = cp->rnmap_name;<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+ for (se = 0; se < adev->gfx.config.max_shader_engines; ++se) {<o:p></o:p></p>
<p class="MsoNormal">+ for (sh = 0; sh < adev->gfx.config.max_sh_per_se; ++sh) {<o:p></o:p></p>
<p class="MsoNormal">+ for (i = 0; i < cp->rnmap_num_instances; ++i) {<o:p></o:p></p>
<p class="MsoNormal">+ gfx_v8_0_select_se_sh(adev, se, sh, i);<o:p></o:p></p>
<p class="MsoNormal">+ count = RREG32(cp->rnmap_addr);<o:p></o:p></p>
<p class="MsoNormal">+ count = RREG32(cp->rnmap_addr);<o:p></o:p></p>
<p class="MsoNormal">+ if (count != 0) {<o:p></o:p></p>
<p class="MsoNormal">+ /*<o:p></o:p></p>
<p class="MsoNormal">+ * Workaround failed.<o:p></o:p></p>
<p class="MsoNormal">+ * If people are interested<o:p></o:p></p>
<p class="MsoNormal">+ * in EDC at all, they will<o:p></o:p></p>
<p class="MsoNormal">+ * want to know which<o:p></o:p></p>
<p class="MsoNormal">+ * counters had problems.<o:p></o:p></p>
<p class="MsoNormal">+ */<o:p></o:p></p>
<p class="MsoNormal">+ DRM_WARN("EDC counter %s is 0x%08x, but should be 0\n.",<o:p></o:p></p>
<p class="MsoNormal">+ name, count);<o:p></o:p></p>
<p class="MsoNormal">+ r = -EINVAL;<o:p></o:p></p>
<p class="MsoNormal">+ goto ret;<o:p></o:p></p>
<p class="MsoNormal">+ }<o:p></o:p></p>
<p class="MsoNormal">+ }<o:p></o:p></p>
<p class="MsoNormal">+ }<o:p></o:p></p>
<p class="MsoNormal">+ }<o:p></o:p></p>
<p class="MsoNormal">+ }<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+ret:<o:p></o:p></p>
<p class="MsoNormal">+ gfx_v8_0_select_se_sh(adev, 0xffffffff, 0xffffffff, 0xffffffff);<o:p></o:p></p>
<p class="MsoNormal">+ mutex_unlock(&adev->grbm_idx_mutex);<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+ return r;<o:p></o:p></p>
<p class="MsoNormal">+}<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">static int gfx_v8_0_do_edc_gpr_workarounds(struct amdgpu_device *adev)<o:p></o:p></p>
<p class="MsoNormal">{<o:p></o:p></p>
<p class="MsoNormal"> struct amdgpu_ring *ring = &adev->gfx.compute_ring[0];<o:p></o:p></p>
<p class="MsoNormal">@@ -1681,18 +1738,36 @@ static int gfx_v8_0_do_edc_gpr_workarounds(struct amdgpu_device *adev)<o:p></o:p></p>
<p class="MsoNormal"> struct fence *f = NULL;<o:p></o:p></p>
<p class="MsoNormal"> int r, i;<o:p></o:p></p>
<p class="MsoNormal"> u32 tmp;<o:p></o:p></p>
<p class="MsoNormal">+ u32 dis_bit;<o:p></o:p></p>
<p class="MsoNormal"> unsigned total_size, vgpr_offset, sgpr_offset;<o:p></o:p></p>
<p class="MsoNormal"> u64 gpu_addr;<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">- /* only supported on CZ */<o:p></o:p></p>
<p class="MsoNormal">- if (adev->asic_type != CHIP_CARRIZO)<o:p></o:p></p>
<p class="MsoNormal">+ if (adev->asic_type != CHIP_CARRIZO) {<o:p></o:p></p>
<p class="MsoNormal">+ /* EDC is only supported on CZ */<o:p></o:p></p>
<p class="MsoNormal">+ return 0;<o:p></o:p></p>
<p class="MsoNormal">+ }<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+ DRM_INFO("Detected Carrizo.\n");<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+ tmp = RREG32(mmCC_GC_EDC_CONFIG);<o:p></o:p></p>
<p class="MsoNormal">+ dis_bit = REG_GET_FIELD(tmp, CC_GC_EDC_CONFIG, DIS_EDC);<o:p></o:p></p>
<p class="MsoNormal">+ if (dis_bit) {<o:p></o:p></p>
<p class="MsoNormal">+ /* On Carrizo, EDC may be disabled by a fuse. */<o:p></o:p></p>
<p class="MsoNormal">+ DRM_INFO("EDC hardware is disabled, GC_EDC_CONFIG: 0x%08x.\n",<o:p></o:p></p>
<p class="MsoNormal">+ tmp);<o:p></o:p></p>
<p class="MsoNormal"> return 0;<o:p></o:p></p>
<p class="MsoNormal">+ }<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal"> /* bail if the compute ring is not ready */<o:p></o:p></p>
<p class="MsoNormal"> if (!ring->ready)<o:p></o:p></p>
<p class="MsoNormal"> return 0;<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">- tmp = RREG32(mmGB_EDC_MODE);<o:p></o:p></p>
<p class="MsoNormal">+ DRM_INFO("Applying EDC workarounds.\n");<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+ /*<o:p></o:p></p>
<p class="MsoNormal">+ * Interested parties can enable EDC using debugfs register reads and<o:p></o:p></p>
<p class="MsoNormal">+ * writes.<o:p></o:p></p>
<p class="MsoNormal">+ */<o:p></o:p></p>
<p class="MsoNormal"> WREG32(mmGB_EDC_MODE, 0);<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal"> total_size =<o:p></o:p></p>
<p class="MsoNormal">@@ -1817,18 +1892,7 @@ static int gfx_v8_0_do_edc_gpr_workarounds(struct amdgpu_device *adev)<o:p></o:p></p>
<p class="MsoNormal"> goto fail;<o:p></o:p></p>
<p class="MsoNormal"> }<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">- tmp = REG_SET_FIELD(tmp, GB_EDC_MODE, DED_MODE, 2);<o:p></o:p></p>
<p class="MsoNormal">- tmp = REG_SET_FIELD(tmp, GB_EDC_MODE, PROP_FED, 1);<o:p></o:p></p>
<p class="MsoNormal">- WREG32(mmGB_EDC_MODE, tmp);<o:p></o:p></p>
<p class="MsoNormal">-<o:p></o:p></p>
<p class="MsoNormal">- tmp = RREG32(mmCC_GC_EDC_CONFIG);<o:p></o:p></p>
<p class="MsoNormal">- tmp = REG_SET_FIELD(tmp, CC_GC_EDC_CONFIG, DIS_EDC, 0) | 1;<o:p></o:p></p>
<p class="MsoNormal">- WREG32(mmCC_GC_EDC_CONFIG, tmp);<o:p></o:p></p>
<p class="MsoNormal">-<o:p></o:p></p>
<p class="MsoNormal">-<o:p></o:p></p>
<p class="MsoNormal">- /* read back registers to clear the counters */<o:p></o:p></p>
<p class="MsoNormal">- for (i = 0; i < ARRAY_SIZE(sec_ded_counter_registers); i++)<o:p></o:p></p>
<p class="MsoNormal">- RREG32(sec_ded_counter_registers[i]);<o:p></o:p></p>
<p class="MsoNormal">+ gfx_v8_0_edc_clear_counters(adev);<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal"> fail:<o:p></o:p></p>
<p class="MsoNormal"> amdgpu_ib_free(adev, &ib, NULL);<o:p></o:p></p>
<p class="MsoNormal">-- <o:p></o:p></p>
<p class="MsoNormal">2.7.4<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">From ec4803205582c1011f5ced1ead70ee244268b4b8 Mon Sep 17 00:00:00 2001<o:p></o:p></p>
<p class="MsoNormal">From: David Panariti <David.Panariti@amd.com><o:p></o:p></p>
<p class="MsoNormal">Date: Wed, 26 Apr 2017 10:13:06 -0400<o:p></o:p></p>
<p class="MsoNormal">Subject: [PATCH 3/3] drm/amdgpu: Add kernel parameter to control use of<o:p></o:p></p>
<p class="MsoNormal">ECC/EDC.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Allow various kinds of memory integrity methods (e.g. ECC/EDC) to be enabled<o:p></o:p></p>
<p class="MsoNormal">or disabled. By default, all features are disabled.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">EDC is Error Detection and Correction. It can detect ECC errors and do 0 or<o:p></o:p></p>
<p class="MsoNormal">more of: count SEC (single error corrected) and DED (double error detected,<o:p></o:p></p>
<p class="MsoNormal">i.e. uncorrected ECC error), halt the affected block, interrupt the CPU.<o:p></o:p></p>
<p class="MsoNormal">Currently, only counting errors is supported.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Signed-off-by: David Panariti <David.Panariti@amd.com><o:p></o:p></p>
<p class="MsoNormal">---<o:p></o:p></p>
<p class="MsoNormal">drivers/gpu/drm/amd/amdgpu/amdgpu.h | 1 +<o:p></o:p></p>
<p class="MsoNormal">drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c | 4 ++++<o:p></o:p></p>
<p class="MsoNormal">drivers/gpu/drm/amd/amdgpu/gfx_v8_0.c | 34 +++++++++++++++++++++++++++-----<o:p></o:p></p>
<p class="MsoNormal">drivers/gpu/drm/amd/include/amd_shared.h | 14 +++++++++++++<o:p></o:p></p>
<p class="MsoNormal">4 files changed, 48 insertions(+), 5 deletions(-)<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu.h b/drivers/gpu/drm/amd/amdgpu/amdgpu.h<o:p></o:p></p>
<p class="MsoNormal">index 4a16e3c..0322392 100644<o:p></o:p></p>
<p class="MsoNormal">--- a/drivers/gpu/drm/amd/amdgpu/amdgpu.h<o:p></o:p></p>
<p class="MsoNormal">+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu.h<o:p></o:p></p>
<p class="MsoNormal">@@ -111,6 +111,7 @@ extern int amdgpu_prim_buf_per_se;<o:p></o:p></p>
<p class="MsoNormal">extern int amdgpu_pos_buf_per_se;<o:p></o:p></p>
<p class="MsoNormal">extern int amdgpu_cntl_sb_buf_per_se;<o:p></o:p></p>
<p class="MsoNormal">extern int amdgpu_param_buf_per_se;<o:p></o:p></p>
<p class="MsoNormal">+extern unsigned amdgpu_ecc_flags;<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal"> #define AMDGPU_DEFAULT_GTT_SIZE_MB 3072ULL /* 3GB by default */<o:p></o:p></p>
<p class="MsoNormal">#define AMDGPU_WAIT_IDLE_TIMEOUT_IN_MS 3000<o:p></o:p></p>
<p class="MsoNormal">diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c<o:p></o:p></p>
<p class="MsoNormal">index ead00d7..00e16ac 100644<o:p></o:p></p>
<p class="MsoNormal">--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c<o:p></o:p></p>
<p class="MsoNormal">+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c<o:p></o:p></p>
<p class="MsoNormal">@@ -110,6 +110,7 @@ int amdgpu_prim_buf_per_se = 0;<o:p></o:p></p>
<p class="MsoNormal">int amdgpu_pos_buf_per_se = 0;<o:p></o:p></p>
<p class="MsoNormal">int amdgpu_cntl_sb_buf_per_se = 0;<o:p></o:p></p>
<p class="MsoNormal">int amdgpu_param_buf_per_se = 0;<o:p></o:p></p>
<p class="MsoNormal">+unsigned amdgpu_ecc_flags = 0;<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal"> MODULE_PARM_DESC(vramlimit, "Restrict VRAM for testing, in megabytes");<o:p></o:p></p>
<p class="MsoNormal">module_param_named(vramlimit, amdgpu_vram_limit, int, 0600);<o:p></o:p></p>
<p class="MsoNormal">@@ -235,6 +236,9 @@ module_param_named(cntl_sb_buf_per_se, amdgpu_cntl_sb_buf_per_se, int, 0444);<o:p></o:p></p>
<p class="MsoNormal">MODULE_PARM_DESC(param_buf_per_se, "the size of Off-Chip Pramater Cache per Shader Engine (default depending on gfx)");<o:p></o:p></p>
<p class="MsoNormal">module_param_named(param_buf_per_se, amdgpu_param_buf_per_se, int, 0444);<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">+MODULE_PARM_DESC(ecc_flags, "ECC/EDC enable flags (0 = disable ECC/EDC (default))");<o:p></o:p></p>
<p class="MsoNormal">+module_param_named(ecc_flags, amdgpu_ecc_flags, uint, 0444);<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal"> static const struct pci_device_id pciidlist[] = {<o:p></o:p></p>
<p class="MsoNormal">#ifdef CONFIG_DRM_AMDGPU_SI<o:p></o:p></p>
<p class="MsoNormal">diff --git a/drivers/gpu/drm/amd/amdgpu/gfx_v8_0.c b/drivers/gpu/drm/amd/amdgpu/gfx_v8_0.c<o:p></o:p></p>
<p class="MsoNormal">index 2f5bf5f..05cab7e 100644<o:p></o:p></p>
<p class="MsoNormal">--- a/drivers/gpu/drm/amd/amdgpu/gfx_v8_0.c<o:p></o:p></p>
<p class="MsoNormal">+++ b/drivers/gpu/drm/amd/amdgpu/gfx_v8_0.c<o:p></o:p></p>
<p class="MsoNormal">@@ -1708,7 +1708,7 @@ static int gfx_v8_0_edc_clear_counters(struct amdgpu_device *adev)<o:p></o:p></p>
<p class="MsoNormal"> count = RREG32(cp->rnmap_addr);<o:p></o:p></p>
<p class="MsoNormal"> if (count != 0) {<o:p></o:p></p>
<p class="MsoNormal"> /*<o:p></o:p></p>
<p class="MsoNormal">- * Workaround failed.<o:p></o:p></p>
<p class="MsoNormal">+ * EDC workaround failed.<o:p></o:p></p>
<p class="MsoNormal"> * If people are interested<o:p></o:p></p>
<p class="MsoNormal"> * in EDC at all, they will<o:p></o:p></p>
<p class="MsoNormal"> * want to know which<o:p></o:p></p>
<p class="MsoNormal">@@ -1747,14 +1747,24 @@ static int gfx_v8_0_do_edc_gpr_workarounds(struct amdgpu_device *adev)<o:p></o:p></p>
<p class="MsoNormal"> return 0;<o:p></o:p></p>
<p class="MsoNormal"> }<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">- DRM_INFO("Detected Carrizo.\n");<o:p></o:p></p>
<p class="MsoNormal">+ DRM_INFO("Detected Carrizo.\n");<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal"> tmp = RREG32(mmCC_GC_EDC_CONFIG);<o:p></o:p></p>
<p class="MsoNormal"> dis_bit = REG_GET_FIELD(tmp, CC_GC_EDC_CONFIG, DIS_EDC);<o:p></o:p></p>
<p class="MsoNormal"> if (dis_bit) {<o:p></o:p></p>
<p class="MsoNormal">- /* On Carrizo, EDC may be disabled by a fuse. */<o:p></o:p></p>
<p class="MsoNormal">- DRM_INFO("EDC hardware is disabled, GC_EDC_CONFIG: 0x%08x.\n",<o:p></o:p></p>
<p class="MsoNormal">- tmp);<o:p></o:p></p>
<p class="MsoNormal">+ /* On Carrizo, EDC may be disabled permanently by a fuse. */<o:p></o:p></p>
<p class="MsoNormal">+ DRM_INFO("Carrizo EDC hardware is disabled, GC_EDC_CONFIG: 0x%08x.\n",<o:p></o:p></p>
<p class="MsoNormal">+ tmp);<o:p></o:p></p>
<p class="MsoNormal">+ return 0;<o:p></o:p></p>
<p class="MsoNormal">+ }<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+ /*<o:p></o:p></p>
<p class="MsoNormal">+ * Check if EDC has been requested by a kernel parameter.<o:p></o:p></p>
<p class="MsoNormal">+ * For Carrizo, EDC is the best/safest mode WRT error handling.<o:p></o:p></p>
<p class="MsoNormal">+ */<o:p></o:p></p>
<p class="MsoNormal">+ if (!(amdgpu_ecc_flags<o:p></o:p></p>
<p class="MsoNormal">+ & (AMD_ECC_SUPPORT_BEST | AMD_ECC_SUPPORT_EDC))) {<o:p></o:p></p>
<p class="MsoNormal">+ DRM_INFO("EDC support has not been requested.\n");<o:p></o:p></p>
<p class="MsoNormal"> return 0;<o:p></o:p></p>
<p class="MsoNormal"> }<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">@@ -1892,6 +1902,20 @@ static int gfx_v8_0_do_edc_gpr_workarounds(struct amdgpu_device *adev)<o:p></o:p></p>
<p class="MsoNormal"> goto fail;<o:p></o:p></p>
<p class="MsoNormal"> }<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">+ /* 00 - GB_EDC_DED_MODE_LOG: Count DED errors but do not halt */<o:p></o:p></p>
<p class="MsoNormal">+ tmp = REG_SET_FIELD(tmp, GB_EDC_MODE, DED_MODE, 0);<o:p></o:p></p>
<p class="MsoNormal">+ /* Do not propagate the errors to the next block. */<o:p></o:p></p>
<p class="MsoNormal">+ tmp = REG_SET_FIELD(tmp, GB_EDC_MODE, PROP_FED, 0);<o:p></o:p></p>
<p class="MsoNormal">+ WREG32(mmGB_EDC_MODE, tmp);<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+ tmp = RREG32(mmCC_GC_EDC_CONFIG);<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">+ /*<o:p></o:p></p>
<p class="MsoNormal">+ * Clear EDC_DISABLE bit so the counters are available.<o:p></o:p></p>
<p class="MsoNormal">+ */<o:p></o:p></p>
<p class="MsoNormal">+ tmp = REG_SET_FIELD(tmp, CC_GC_EDC_CONFIG, DIS_EDC, 0);<o:p></o:p></p>
<p class="MsoNormal">+ WREG32(mmCC_GC_EDC_CONFIG, tmp);<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal"> gfx_v8_0_edc_clear_counters(adev);<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal"> fail:<o:p></o:p></p>
<p class="MsoNormal">diff --git a/drivers/gpu/drm/amd/include/amd_shared.h b/drivers/gpu/drm/amd/include/amd_shared.h<o:p></o:p></p>
<p class="MsoNormal">index 2ccf44e..c4fd013 100644<o:p></o:p></p>
<p class="MsoNormal">--- a/drivers/gpu/drm/amd/include/amd_shared.h<o:p></o:p></p>
<p class="MsoNormal">+++ b/drivers/gpu/drm/amd/include/amd_shared.h<o:p></o:p></p>
<p class="MsoNormal">@@ -179,6 +179,20 @@ struct amd_pp_profile {<o:p></o:p></p>
<p class="MsoNormal">#define AMD_PG_SUPPORT_GFX_QUICK_MG (1 << 11)<o:p></o:p></p>
<p class="MsoNormal">#define AMD_PG_SUPPORT_GFX_PIPELINE (1 << 12)<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">+/*<o:p></o:p></p>
<p class="MsoNormal">+ * ECC flags<o:p></o:p></p>
<p class="MsoNormal">+ * Allows the user to choose what kind of error detection/correction is used.<o:p></o:p></p>
<p class="MsoNormal">+ * Currently, EDC is supported on Carrizo.<o:p></o:p></p>
<p class="MsoNormal">+ *<o:p></o:p></p>
<p class="MsoNormal">+ * The AMD_ECC_SUPPORT_BEST bit is used to allow a user to have the driver<o:p></o:p></p>
<p class="MsoNormal">+ * set what it thinks is best/safest mode. This may not be the same as the<o:p></o:p></p>
<p class="MsoNormal">+ * default, depending on the GPU and the application.<o:p></o:p></p>
<p class="MsoNormal">+ * Using a single bit makes it easy to request the best support without<o:p></o:p></p>
<p class="MsoNormal">+ * needing to know all currently supported modes.<o:p></o:p></p>
<p class="MsoNormal">+ */<o:p></o:p></p>
<p class="MsoNormal">+#define AMD_ECC_SUPPORT_BEST (1 << 0)<o:p></o:p></p>
<p class="MsoNormal">+#define AMD_ECC_SUPPORT_EDC (1 << 1)<o:p></o:p></p>
<p class="MsoNormal">+<o:p></o:p></p>
<p class="MsoNormal">enum amd_pm_state_type {<o:p></o:p></p>
<p class="MsoNormal"> /* not used for dpm */<o:p></o:p></p>
<p class="MsoNormal"> POWER_STATE_TYPE_DEFAULT,<o:p></o:p></p>
<p class="MsoNormal">-- <o:p></o:p></p>
<p class="MsoNormal">2.7.4<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
</body>
</html>