<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
{font-family:SimSun;
panose-1:2 1 6 0 3 1 1 1 1 1;}
@font-face
{font-family:"Cambria Math";
panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
{font-family:Calibri;
panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
{font-family:SimSun;
panose-1:2 1 6 0 3 1 1 1 1 1;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
{margin:0in;
margin-bottom:.0001pt;
font-size:11.0pt;
font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
{mso-style-priority:99;
color:#0563C1;
text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
{mso-style-priority:99;
color:#954F72;
text-decoration:underline;}
span.EmailStyle17
{mso-style-type:personal-compose;
font-family:"Calibri",sans-serif;
color:windowtext;}
.MsoChpDefault
{mso-style-type:export-only;
font-family:"Calibri",sans-serif;}
@page WordSection1
{size:8.5in 11.0in;
margin:1.0in 1.25in 1.0in 1.25in;}
div.WordSection1
{page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="#0563C1" vlink="#954F72">
<div class="WordSection1">
<p class="MsoNormal">Beignet 1.2.0<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">========================<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Beignet development team is pleased to announce that Beignet version 1.2.0 has been released. In this release, Beignet continue to improvement the quality, performance and debug support. In this release, Beignet add Broxton and Kabylake
platforms support, and new llvm version support, includ llvm3.7 and llvm 3.8. In this release, Beignet enable debug info when output ASM and also add profiling support. Meanwhile, Beignet add more and more extensions and features, such as full cl_intel_subgroups
extension, intel_accelerator and basic intel_motion_estimation and so on. The performance is also improved, especially for some algorithm, for example GEMM algorithm have about 2x gain.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">The highlighted improvements are as below:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">1. 6th generation Intel Atom Processors (Broxton) support.<o:p></o:p></p>
<p class="MsoNormal">2. 6th generation Intel Core Processors (Kabylake) support.<o:p></o:p></p>
<p class="MsoNormal">3. LLVM 3.7 and 3.8 support.<o:p></o:p></p>
<p class="MsoNormal">4. ASM debug infomation and profiling support.<o:p></o:p></p>
<p class="MsoNormal">5. Experimental double data type support for processors after 6th generation(Broadwell) .<o:p></o:p></p>
<p class="MsoNormal">6. Full cl_intel_subgroups extension.<o:p></o:p></p>
<p class="MsoNormal">7. OpenCL 2.0 workgroup built-in functions.<o:p></o:p></p>
<p class="MsoNormal">8. Local copy propagation optimization and other optimizations<o:p></o:p></p>
<p class="MsoNormal">9. intel_accelerator extension and basic intel_motion_estimation extension.<o:p></o:p></p>
<p class="MsoNormal">10. Android build.<o:p></o:p></p>
<p class="MsoNormal">11. Refined printf implementation.<o:p></o:p></p>
<p class="MsoNormal">12. Bug fixes since last release.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Git tag: Release_v1.2.0<o:p></o:p></p>
<p class="MsoNormal">Gitweb URL: http://cgit.freedesktop.org/beignet<o:p></o:p></p>
<p class="MsoNormal">https://01.org/sites/default/files/beignet-1.2.0-source.tar.gz<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">md5sum: f25278189a0a713380a662f883ecb00d beignet-1.2.0-source.tar.gz<o:p></o:p></p>
<p class="MsoNormal">sha1sum: 33136e80d2a2b725a37f1ee3ea7c655a3f6eb5af beignet-1.2.0-source.tar.gz<o:p></o:p></p>
<p class="MsoNormal">sha256sum: fc7af19efb7596b04510d26c558a576eba3e95e1ef86fd6951213c6a4bf58bff beignet-1.2.0-source.tar.gz<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">-----------------------------------------------------------------<o:p></o:p></p>
<p class="MsoNormal">Armin K (3):<o:p></o:p></p>
<p class="MsoNormal"> Fix build with clang++<o:p></o:p></p>
<p class="MsoNormal"> RFC: Fix building with clang++ -stdlib=libc++<o:p></o:p></p>
<p class="MsoNormal"> Fix building with clang++<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Bai Yannan (5):<o:p></o:p></p>
<p class="MsoNormal"> GBE/DebugInfo: Enable new feature<o:p></o:p></p>
<p class="MsoNormal"> GBE/DebugInfo: Pass debug info :llvm IR => GEN IR<o:p></o:p></p>
<p class="MsoNormal"> GBE/DebugInfo: Pass debug info : GEN IR => SEL IR<o:p></o:p></p>
<p class="MsoNormal"> GBE/DebugInfo: Pass debug info : SEL IR => GenInsn<o:p></o:p></p>
<p class="MsoNormal"> GBE/DebugInfo: Print line and column NO. with ASM<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Chuanbo Weng (10):<o:p></o:p></p>
<p class="MsoNormal"> Add extension clCreateBufferFromFdINTEL to create cl buffer by external buffer object's fd.<o:p></o:p></p>
<p class="MsoNormal"> Add extension clCreateImageFromFdINTEL to create cl image by external fd.<o:p></o:p></p>
<p class="MsoNormal"> Add built-in function __gen_ocl_vme.<o:p></o:p></p>
<p class="MsoNormal"> Add extensions intel_accelerator and basic intel_motion_estimation.<o:p></o:p></p>
<p class="MsoNormal"> Add basic utest for block_motion_estimate_intel.<o:p></o:p></p>
<p class="MsoNormal"> Add document of video motion estimation support.<o:p></o:p></p>
<p class="MsoNormal"> Full support of cl_intel_motion_estimation extension.<o:p></o:p></p>
<p class="MsoNormal"> runtime: The depth should be 1 for CL_MEM_OBJECT_IMAGE2D in beignet's implementation.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: fix one typo error.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: set size member of cl_image created by clCreateImageFromFdINTEL.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Francisco Jerez (1):<o:p></o:p></p>
<p class="MsoNormal"> SKL: Use kernel-defined MOCS values instead of assuming hardware defaults.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Frank Dittrich (1):<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix memleak in serialize_program<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Giuseppe Bilotta (2):<o:p></o:p></p>
<p class="MsoNormal"> Fix sizing error for bitfield<o:p></o:p></p>
<p class="MsoNormal"> Increase size for compile log output<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Grigore Lupescu (16):<o:p></o:p></p>
<p class="MsoNormal"> Backend: Workgroup reduce redesign using shared local memory<o:p></o:p></p>
<p class="MsoNormal"> Backend: Support for workgroup op predicate, scan inclusive/exclusive<o:p></o:p></p>
<p class="MsoNormal"> Backend: Initial support for long/ulong types in workgroup ops<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix barrier placement in workgroup functions<o:p></o:p></p>
<p class="MsoNormal"> Backend: Workgroup scan cmp qword, workaround for execution width 16<o:p></o:p></p>
<p class="MsoNormal"> Backend: Full support for workgroup broadcast<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add workgroup reduce any/all tests<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add workgroup scan exclusive tests<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add workgroup scan inclusive tests<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add workgroup broadcast tests<o:p></o:p></p>
<p class="MsoNormal"> Benchmark: Add performance tests for workgroup reduce/scan functions<o:p></o:p></p>
<p class="MsoNormal"> Benchmark: Add performance tests for workgroup broadcast<o:p></o:p></p>
<p class="MsoNormal"> Benchmark: Evaluate math performance on intervals<o:p></o:p></p>
<p class="MsoNormal"> Backend: Optimization internal math, lower polynomials<o:p></o:p></p>
<p class="MsoNormal"> Backend: Optimization internal math, use native<o:p></o:p></p>
<p class="MsoNormal"> Backend: Optimization internal math, use mad<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Guo Yejun (52):<o:p></o:p></p>
<p class="MsoNormal"> Use Integer for U32/S32 Immediate load.<o:p></o:p></p>
<p class="MsoNormal"> generate sub_group_id inside kernel instead of payload<o:p></o:p></p>
<p class="MsoNormal"> fix issue when build against llvm3.3<o:p></o:p></p>
<p class="MsoNormal"> remove GBE_CURBE_STACK_POINTER in payload<o:p></o:p></p>
<p class="MsoNormal"> correct simd width when dst of simd_shuffle is scalar<o:p></o:p></p>
<p class="MsoNormal"> generate MOV instruction at selection stage when do simd_shuffle with imm value.<o:p></o:p></p>
<p class="MsoNormal"> add basic function to dump Selection IR<o:p></o:p></p>
<p class="MsoNormal"> add basic structure for selection IR optimization<o:p></o:p></p>
<p class="MsoNormal"> add local copy propagation optimization for each basic block<o:p></o:p></p>
<p class="MsoNormal"> refine code to separate the usage of data and image2d_from_buffer<o:p></o:p></p>
<p class="MsoNormal"> enable USE_HOST_PTR for cl image with userptr to avoid extra copying<o:p></o:p></p>
<p class="MsoNormal"> add utest runtime_use_host_ptr_image<o:p></o:p></p>
<p class="MsoNormal"> fix uniform case for ByteGather<o:p></o:p></p>
<p class="MsoNormal"> add conditions of pitch and h to enable userptr for climage_use_host_ptr<o:p></o:p></p>
<p class="MsoNormal"> fix a regression issue caused by LocalCopyPropagation<o:p></o:p></p>
<p class="MsoNormal"> fix a long relative regreesion issue on BSW caused by local copy propagation<o:p></o:p></p>
<p class="MsoNormal"> add comments to explain 32bit is enough to represent w+hstrid+vstride<o:p></o:p></p>
<p class="MsoNormal"> fix regression issue for climage + uesrptr<o:p></o:p></p>
<p class="MsoNormal"> add more OP for LOGICAL_SRCMOD case<o:p></o:p></p>
<p class="MsoNormal"> make Beignet as intermedia layer of CMRT<o:p></o:p></p>
<p class="MsoNormal"> add utest to demo how to run CM kernerl via OpenCL APIs<o:p></o:p></p>
<p class="MsoNormal"> add Broxton support<o:p></o:p></p>
<p class="MsoNormal"> add support for build option -cl-fast-relaxed-math<o:p></o:p></p>
<p class="MsoNormal"> output warning message if do not find a good local_work_size<o:p></o:p></p>
<p class="MsoNormal"> fix a bug when the first operand of intel_sub_group_shuffle is uniform<o:p></o:p></p>
<p class="MsoNormal"> considering width and hstride when do unpacked_uw<o:p></o:p></p>
<p class="MsoNormal"> do not call memcpy for cl_enqueue_read_buffer if userptr is enabled<o:p></o:p></p>
<p class="MsoNormal"> change built-in function name from get_sub_group_size to get_max_sub_group_size<o:p></o:p></p>
<p class="MsoNormal"> change built-in function name from get_sub_group_id to get_sub_group_local_id<o:p></o:p></p>
<p class="MsoNormal"> fix typo for DEBUGP to avoid print extra empty line<o:p></o:p></p>
<p class="MsoNormal"> correct ASM output for byte scattered read/write<o:p></o:p></p>
<p class="MsoNormal"> correct the dst type to ud instead of uw for byte scattered read<o:p></o:p></p>
<p class="MsoNormal"> fix a potential issue of SEL IR optimization when subphysical is true<o:p></o:p></p>
<p class="MsoNormal"> enable byte gather for vload2/3/4/8(offset, char*) on SKL, BXT and BDW<o:p></o:p></p>
<p class="MsoNormal"> enable FP_CONTRACT on as default, and implemented with MAD<o:p></o:p></p>
<p class="MsoNormal"> change behavior of mul24/mad24 when out of range<o:p></o:p></p>
<p class="MsoNormal"> utest: do not check MV near image border<o:p></o:p></p>
<p class="MsoNormal"> set SIMD width as 1 for mad when the dst is uniform<o:p></o:p></p>
<p class="MsoNormal"> only release cmrt device when it is already created<o:p></o:p></p>
<p class="MsoNormal"> output message instead of assert when .bc file does not exist<o:p></o:p></p>
<p class="MsoNormal"> utests: add access qualifier for image in kernel<o:p></o:p></p>
<p class="MsoNormal"> enlarge buf size to avoid memory out of range written by GPU (kernel)<o:p></o:p></p>
<p class="MsoNormal"> do not use const pointer<o:p></o:p></p>
<p class="MsoNormal"> change the bahavior when writing to 3-component vector data types<o:p></o:p></p>
<p class="MsoNormal"> utest: do not check the padding componenet for 3-component vector data types<o:p></o:p></p>
<p class="MsoNormal"> utests: fix issue of CL_PROGRAM_BINARY_SIZES query<o:p></o:p></p>
<p class="MsoNormal"> utests: change tolerance check for lgamma<o:p></o:p></p>
<p class="MsoNormal"> utests: only check -dump-spir-binary on beignet implementation<o:p></o:p></p>
<p class="MsoNormal"> remove "\n" in output message when test is failed<o:p></o:p></p>
<p class="MsoNormal"> use different pointer alignment for different implementation<o:p></o:p></p>
<p class="MsoNormal"> only check beignet special test cases on beignet<o:p></o:p></p>
<p class="MsoNormal"> add help for 'make package'<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Jan Vesely (1):<o:p></o:p></p>
<p class="MsoNormal"> cl_api; Check image origin and region for NULL<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Junyan He (68):<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add NULL pointer check in clGetKernelArgInfo<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add -cl-kernel-arg-info to the utest test_get_arg_info<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine ConvertInstruction logic in insn_selection<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix the bug for double imm reg.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Redefine double register pattern.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add FDIV64 function for gen_insn_selection.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add gen8 instruction field for special accumulator.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Delete getDoubleExecWidth and refine handleDouble.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix a bug for double imm src setting.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add MATH_WITH_ACC function.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add the MADM function to gen8 encoder.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Implement FDIV64 on BDW.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add madm and invm instrucions to disasm.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Refine ext enable function for platform.<o:p></o:p></p>
<p class="MsoNormal"> Utests: Add double check and refine compiler_double case.<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add double division test.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Delete the useless MOV_DF instruction.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Delete LOAD_DF_IMM instruction.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add double conversion to insn selection.<o:p></o:p></p>
<p class="MsoNormal"> Utests: Add test cases for double conversion.<o:p></o:p></p>
<p class="MsoNormal"> Utest: Fix a bug for double div.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix a potential bug for uniform conversion.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix half->long convertion bug for BSW.<o:p></o:p></p>
<p class="MsoNormal"> CMake: Add -lrt to the link command of libcl.so<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add ProfilingInfo class to ir.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add StoreProfiling and CalcTimestamp instructions<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add ProfilingInserter and a new function pass.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add profiling registers to curbe.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add ProfilingInfo to Unit.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Insert store_profiling before lowed return.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add CalcTimestamp and StoreProfiling.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add IVAR OCL_PROFILING_LOG to control profiling log.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add CalcTimestamp and StoreProfiling to insn selection.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add a auxiliary function to convert GenReg to uniform.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add tm0 function for arf timestamp register.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add profilingProlog function for GenContext.<o:p></o:p></p>
<p class="MsoNormal"> Add profiling info APIs to runtime.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Bind the profiling buffer when profiling enabled.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix two bugs about curbe related pointer.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Avoid CALC_TIMESTAMP and STORE_PROFILING being scheduled.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add ADD_ and SUB_ timestamps help functions.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Implement emitCalcTimestampInstruction in GenContext.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Implement StoreProfilingInstruction in GenContext.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Append the reg interval for registers need for profiling.<o:p></o:p></p>
<p class="MsoNormal"> Utests: Fix the failure for half math tests.<o:p></o:p></p>
<p class="MsoNormal"> libocl: Add the module for work_group functions.<o:p></o:p></p>
<p class="MsoNormal"> Add the WorkGroupInstruction as a new type of instruction.<o:p></o:p></p>
<p class="MsoNormal"> Add WorkGroup functions to Gen IR logic in llvm_gen_backend.<o:p></o:p></p>
<p class="MsoNormal"> Handle the WorkGroup_Broadcast logic in insn_selection.<o:p></o:p></p>
<p class="MsoNormal"> Add utest for workgroup_broadcast.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add sr0 reg helper function.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add tidMapSLM and wgBroadcastSLM to each function.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add threadid as a curbe register.<o:p></o:p></p>
<p class="MsoNormal"> libocl: Refine the workgroup functions, add signed info.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Establishing the thread/TID-EUID map.<o:p></o:p></p>
<p class="MsoNormal"> Add forward message function for gen encoder.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add WORKGROUP_OP instruction selection.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add state register into schedule consideration.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Implement reduce min and max in gen_context<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add the threadid calculation for curbe.<o:p></o:p></p>
<p class="MsoNormal"> Utests: Add test cases for workgroup reduce max/min.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add reduce add to gen_context.<o:p></o:p></p>
<p class="MsoNormal"> Utests: Add test cases for reduce add.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix a memory leak for structurizer.<o:p></o:p></p>
<p class="MsoNormal"> Backend: Use KernelArgument::ArgInfo to replace llvm's arg info.<o:p></o:p></p>
<p class="MsoNormal"> Add the serializeToBin and deserializeFromBin for kernel arg info.<o:p></o:p></p>
<p class="MsoNormal"> Add several printf utest cases.<o:p></o:p></p>
<p class="MsoNormal"> Fix the bug when we pass argument with spaces.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Laura Ekstrand (7):<o:p></o:p></p>
<p class="MsoNormal"> backend/src/backend: Handle -dump-opt-llvm=[PATH]<o:p></o:p></p>
<p class="MsoNormal"> backend: Handle (but ignore) -dump-opt-asm=[PATH].<o:p></o:p></p>
<p class="MsoNormal"> backend: Move ASM printing to a helper function.<o:p></o:p></p>
<p class="MsoNormal"> backend: Convert outputAssembly to C file I/O.<o:p></o:p></p>
<p class="MsoNormal"> backend, src: Add ASM file name to gbe_program_new_from_llvm<o:p></o:p></p>
<p class="MsoNormal"> backend: Add ASM file name to GenProgram object.<o:p></o:p></p>
<p class="MsoNormal"> backend: Add ASM file name to GenContext object.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Luo Xionghu (62):<o:p></o:p></p>
<p class="MsoNormal"> libocl: fix degrees function precision issue.<o:p></o:p></p>
<p class="MsoNormal"> Update last event status in clFinish.<o:p></o:p></p>
<p class="MsoNormal"> fix utest fail.<o:p></o:p></p>
<p class="MsoNormal"> GBE/IR: add collectInsnNum to collect block instruction number.<o:p></o:p></p>
<p class="MsoNormal"> GBE/PRINTF: store variable instead of pointer in "slots".<o:p></o:p></p>
<p class="MsoNormal"> should check the return value of cl_program_new.<o:p></o:p></p>
<p class="MsoNormal"> return 32 could gain 0.2% performance on opencv optical flow case.<o:p></o:p></p>
<p class="MsoNormal"> enable create image 2d from buffer in clCreateImage.<o:p></o:p></p>
<p class="MsoNormal"> add utest for creating 2d image from buffer.<o:p></o:p></p>
<p class="MsoNormal"> fix bswap bug.<o:p></o:p></p>
<p class="MsoNormal"> add bswap64 for gen7/gen75 and gen8 seperately.<o:p></o:p></p>
<p class="MsoNormal"> add bswap64 in utest.<o:p></o:p></p>
<p class="MsoNormal"> reset the variables in printf_paser to NULL.<o:p></o:p></p>
<p class="MsoNormal"> using name instead of index to query from ConstantSet.<o:p></o:p></p>
<p class="MsoNormal"> alignment of NO TILING surface limitation shouldn't be removed.<o:p></o:p></p>
<p class="MsoNormal"> Revert "return 32 could gain 0.2% performance on opencv optical flow case."<o:p></o:p></p>
<p class="MsoNormal"> pitchalignment should be set to 1.<o:p></o:p></p>
<p class="MsoNormal"> use sampler to copy image_from_buffer to another image for verification.<o:p></o:p></p>
<p class="MsoNormal"> use table to define and query binary headers.<o:p></o:p></p>
<p class="MsoNormal"> set the pitch of image from buffer to the buffer's pitch.<o:p></o:p></p>
<p class="MsoNormal"> runtime: extension size not enough.<o:p></o:p></p>
<p class="MsoNormal"> gbe: fix uitofp instruction issue.<o:p></o:p></p>
<p class="MsoNormal"> check image from buffer's base address alignment.<o:p></o:p></p>
<p class="MsoNormal"> gbe/libocl: define the vloada_xxx function instead of using MACRO.<o:p></o:p></p>
<p class="MsoNormal"> gbe: use kernel_arg_base_type to recognize image arguments.<o:p></o:p></p>
<p class="MsoNormal"> gbe/libocl: change xxx_fence function to OVERLOADABLE.<o:p></o:p></p>
<p class="MsoNormal"> runtime: initialize the memory content to 0.<o:p></o:p></p>
<p class="MsoNormal"> runtime: fix clCompileProgram bug.<o:p></o:p></p>
<p class="MsoNormal"> runtime: fix clLinkProgram bug.<o:p></o:p></p>
<p class="MsoNormal"> runtime: add missing supported format image_1d_buffer.<o:p></o:p></p>
<p class="MsoNormal"> gbe: add vec_type_hint's type into functionAttributes.<o:p></o:p></p>
<p class="MsoNormal"> gbe/libocl: define the gentype half_xxx math function instead of using MACRO.<o:p></o:p></p>
<p class="MsoNormal"> change the sampler type value to keep same with spir spec.<o:p></o:p></p>
<p class="MsoNormal"> fix gcc build error.<o:p></o:p></p>
<p class="MsoNormal"> backend: enable option -dump-spir-binary to generate SPIR binary from beignet.<o:p></o:p></p>
<p class="MsoNormal"> utest: add utest to generate spir binary from beignet.<o:p></o:p></p>
<p class="MsoNormal"> fix LLVM 3.5 fail.<o:p></o:p></p>
<p class="MsoNormal"> fix workgroup_broadcast instruction debug mode assert.<o:p></o:p></p>
<p class="MsoNormal"> fix debug instruction welform assert.<o:p></o:p></p>
<p class="MsoNormal"> should convert from llvm address to GEN address space to compare.<o:p></o:p></p>
<p class="MsoNormal"> add sanity check for Image Region in runtime.<o:p></o:p></p>
<p class="MsoNormal"> buf[0] destroyed twice in event cases.<o:p></o:p></p>
<p class="MsoNormal"> standalone utest for unified OpenCL implementation.<o:p></o:p></p>
<p class="MsoNormal"> fix failed cases for stand alone utest;<o:p></o:p></p>
<p class="MsoNormal"> add functions cl_check_beignet.<o:p></o:p></p>
<p class="MsoNormal"> handle simd8 and simd16 accrordingly for alu3.<o:p></o:p></p>
<p class="MsoNormal"> enable utest compiler_math_3op for mad test.<o:p></o:p></p>
<p class="MsoNormal"> assert equation issue.<o:p></o:p></p>
<p class="MsoNormal"> write mask in disassembly not parse correctly.<o:p></o:p></p>
<p class="MsoNormal"> 3 op math functions dst need 16 byte align when allocate register.<o:p></o:p></p>
<p class="MsoNormal"> add howto for stand alone utest.<o:p></o:p></p>
<p class="MsoNormal"> gbe: ts array out of boundary.<o:p></o:p></p>
<p class="MsoNormal"> fix kernel build warnings.<o:p></o:p></p>
<p class="MsoNormal"> gbe/llvm: fix potential null pointer dereference.<o:p></o:p></p>
<p class="MsoNormal"> no return value for non-void function.<o:p></o:p></p>
<p class="MsoNormal"> runtime: error handling to avoid null pointer dereference.<o:p></o:p></p>
<p class="MsoNormal"> utest: error handling to avoid null pointer dereference.<o:p></o:p></p>
<p class="MsoNormal"> file name length overflow check.<o:p></o:p></p>
<p class="MsoNormal"> utest: init uninitialized local variables.<o:p></o:p></p>
<p class="MsoNormal"> gbe/ir: defaultData is not initialized by default.<o:p></o:p></p>
<p class="MsoNormal"> gbe/ir: initialize the InstructionBase by a straightforward way.<o:p></o:p></p>
<p class="MsoNormal"> runtime: thread_ids not initialized after created.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Manasi Navare (4):<o:p></o:p></p>
<p class="MsoNormal"> backend: Turn on ASM dump.<o:p></o:p></p>
<p class="MsoNormal"> backend/src/backend: Handle -dump-opt-llvm=[PATH] in clCompileProgram and clBuildProgram OpenCL API<o:p></o:p></p>
<p class="MsoNormal"> Add -dump-opt-asm support to the clLinkProgram() API<o:p></o:p></p>
<p class="MsoNormal"> utests: Added unit tests to test LLVM and ASM dump generation in a two step build process with clCompile and clLink APIs.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Meng Mengmeng (8):<o:p></o:p></p>
<p class="MsoNormal"> fix a powr function issue in cpu compiler math<o:p></o:p></p>
<p class="MsoNormal"> add utests option: -j which specifies the 'number' of jobs (multi-thread)<o:p></o:p></p>
<p class="MsoNormal"> add benckmark for copy data from buffer to buffer<o:p></o:p></p>
<p class="MsoNormal"> add benckmark for copy data from image to image<o:p></o:p></p>
<p class="MsoNormal"> Add a option which could set the benchmark unit properly.<o:p></o:p></p>
<p class="MsoNormal"> Refine the benchmark tests: copy buffer and image.<o:p></o:p></p>
<p class="MsoNormal"> Add a benchmark which test do 3*3 median filter in buffer.<o:p></o:p></p>
<p class="MsoNormal"> Add a benchmark which test do 3*3 median filter in image.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Midhun Kodiyath (2):<o:p></o:p></p>
<p class="MsoNormal"> Set proper Vendor ID<o:p></o:p></p>
<p class="MsoNormal"> Calculate appropriate timestamps for cl profile<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Pan Xiuli (85):<o:p></o:p></p>
<p class="MsoNormal"> Fix clGetKernelArgInfo fail on piglit<o:p></o:p></p>
<p class="MsoNormal"> Driver: fix the annoying "Failed to release userptr..." error message<o:p></o:p></p>
<p class="MsoNormal"> Fix gpgpu node related bug<o:p></o:p></p>
<p class="MsoNormal"> runtime: refine the last_event in queue to a list<o:p></o:p></p>
<p class="MsoNormal"> Fix a event leak in create context<o:p></o:p></p>
<p class="MsoNormal"> utests: event should be released<o:p></o:p></p>
<p class="MsoNormal"> drivers: change the buf size to size_t<o:p></o:p></p>
<p class="MsoNormal"> runtime: refine the cl_device_id to support bigger memory<o:p></o:p></p>
<p class="MsoNormal"> driver: add setup_bti_gen9 for bigger buffer up to 4G<o:p></o:p></p>
<p class="MsoNormal"> runtime: dynamically get global memory size and max alloc size<o:p></o:p></p>
<p class="MsoNormal"> utests: fix multithread queue chaos<o:p></o:p></p>
<p class="MsoNormal"> utests: fix image_from_buffer bugs<o:p></o:p></p>
<p class="MsoNormal"> utests: fix compiler_fill_image_2d_array random bug<o:p></o:p></p>
<p class="MsoNormal"> Backend: enable to choose notification register<o:p></o:p></p>
<p class="MsoNormal"> Backend: add debugwait function<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add gen9 barrier prediction setting<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine printfs into ir unit<o:p></o:p></p>
<p class="MsoNormal"> libocl: Add three work-item built-in function<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add test for get_global/local_linear_id<o:p></o:p></p>
<p class="MsoNormal"> Backend: refine mix with hardware lrp function<o:p></o:p></p>
<p class="MsoNormal"> utests: add an utest for mix<o:p></o:p></p>
<p class="MsoNormal"> Backend: Implement the non-constant extractelement scalarize<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add a bitonic sort test for non-constant extractelement<o:p></o:p></p>
<p class="MsoNormal"> Driver: Fix GPGPU delete bug<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine new instruction with IRBuilder create<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add support for LLVM release 3.8<o:p></o:p></p>
<p class="MsoNormal"> Backend: Remove uselsee ParseCommandLineOptions<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add SKL device id for new SKL device<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix bug build with clang<o:p></o:p></p>
<p class="MsoNormal"> Add support for gcc 6<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix printfs mem leak<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix memleak form abi::__cxa_demangle<o:p></o:p></p>
<p class="MsoNormal"> Utest: Fix utest memleaks<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Fix memleak of barrier evnets<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Fix memleak in build program for bin<o:p></o:p></p>
<p class="MsoNormal"> Benchmark: Fix benchmark bugs with image map<o:p></o:p></p>
<p class="MsoNormal"> Benchmark: Fix Benchmark heap use after free problem<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine workgroup all with SIMD_ALL algorithm<o:p></o:p></p>
<p class="MsoNormal"> Backend: Copy workgroup emit function to gen8<o:p></o:p></p>
<p class="MsoNormal"> Utest: Remove some unsuport work group tests<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add uncompatiblePCHOptions for OCL20<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add workaround for instcombine will optimize fabs<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Disable image hostptr for default<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Fix thread id calculation.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add API clGetKernelSubGroupInfoKHR for subgroup extension<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add subgroup work item builtin functions<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add subgroup work item test cases<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine return value of sub_group_all/any to 1<o:p></o:p></p>
<p class="MsoNormal"> Utest: Remove old sub_group_all/any utest<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add sub_group built-in functions for intel extension<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add test case for sub_group functions<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add intel_sub_group_block_read/write form buffer<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add tset case for block read/write buffer<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add intel_sub_group_block_read/write form image<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add tset case for block read/write image<o:p></o:p></p>
<p class="MsoNormal"> Utest: Porting to GCC6<o:p></o:p></p>
<p class="MsoNormal"> Libocl: Add define for new added cl_khr_3d_image_writes extension<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add intel_subgroups extensions<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine block read/write buffer<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine block read image<o:p></o:p></p>
<p class="MsoNormal"> CMAKE: Use DRM_INTEL_LIBDIR for CHECK_LIBRARY_EXISTS path<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add subgroup extension API in clGetExtensionFunctionAddress<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add check for cl_intel_subgroups extension tests<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add missing math function control code for gen8+<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine sel ir optimization<o:p></o:p></p>
<p class="MsoNormal"> CMAKE: Make utests and benchmark not build for default<o:p></o:p></p>
<p class="MsoNormal"> Backend: Change disable compact to compact version<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add gen8+ instruction compact support<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add intel_sub_group_shuffle_down/up/xor with shuffle<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add test case for sub_group_shuffle_down/up/xor<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add check for utest multithread run<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add check for OpenCL 2.0 extension<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix image block write bug in simd8<o:p></o:p></p>
<p class="MsoNormal"> Utset: Add check for workgroup tests<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Fix hang for bsw device with 12 EU<o:p></o:p></p>
<p class="MsoNormal"> Utest: Move half related helper function into utest helper<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add as_float as_uint helper function<o:p></o:p></p>
<p class="MsoNormal"> Libocl: Add vload\store for half type<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add test case for half type vload\store<o:p></o:p></p>
<p class="MsoNormal"> Libocl: Add half type dot<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add half type support for sub group functions<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add half type for mad<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add half type mad test case<o:p></o:p></p>
<p class="MsoNormal"> Utest: Fix utest case with issues value<o:p></o:p></p>
<p class="MsoNormal"> Utest: Refine utest_run -l option<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Rebecca N. Palmer (3):<o:p></o:p></p>
<p class="MsoNormal"> GBE: Don't read past end of printf format string<o:p></o:p></p>
<p class="MsoNormal"> FindLLVM: allow LLVM/Clang 3.7<o:p></o:p></p>
<p class="MsoNormal"> Report build failures in backend to the build log<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Ross Burton (2):<o:p></o:p></p>
<p class="MsoNormal"> CMakeLists: respect existing CMAKE_C/CXX_FLAGS<o:p></o:p></p>
<p class="MsoNormal"> Ensure paths to beignet.bc and beignet.pch include a / before the filename<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Ruiling Song (20):<o:p></o:p></p>
<p class="MsoNormal"> GBE: Fix build error.<o:p></o:p></p>
<p class="MsoNormal"> runtime: add Broadwell deviceID 0x162B<o:p></o:p></p>
<p class="MsoNormal"> runtime: add detailed broadwell device name.<o:p></o:p></p>
<p class="MsoNormal"> GBE: add check dumpASMFileName.empty()<o:p></o:p></p>
<p class="MsoNormal"> GBE: fix ub1grf(nr, subnr) issue.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Minor refine uw1grf(nr, subnr).<o:p></o:p></p>
<p class="MsoNormal"> GBE: Implement liveness dump.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Fix unaligned load/store issues.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Refine ir for memory operation like atomic/load/store<o:p></o:p></p>
<p class="MsoNormal"> GBE: CreateCall2 is removed in llvm 3.7.<o:p></o:p></p>
<p class="MsoNormal"> utest: write to dst buffer to fix utest failure<o:p></o:p></p>
<p class="MsoNormal"> runtime: add macro DEBUGP() to handle debug printf.<o:p></o:p></p>
<p class="MsoNormal"> GBE: try to avoid bank conflict in register allocator.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Do more aggressive load/store merging.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Optimize extraLiveOut register info.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Fix two bugs in loop preheader.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Improve spill policy by considering use count.<o:p></o:p></p>
<p class="MsoNormal"> GBE: handle mad with execution width of one.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Handle null and uninitialized pointer when do pointer/bti analysis.<o:p></o:p></p>
<p class="MsoNormal"> GBE: handle Instrinsic trap and unreachable instruction.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Sean Lynch (1):<o:p></o:p></p>
<p class="MsoNormal"> Prepend std namespace to isnan and isinf calls.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Sirisha Gandikota (1):<o:p></o:p></p>
<p class="MsoNormal"> utests: Added unit tests to test LLVM and ASM dump generation.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Steven Newbury (1):<o:p></o:p></p>
<p class="MsoNormal"> FindLLVM: check for empty system-libs variable<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Yan Wang (15):<o:p></o:p></p>
<p class="MsoNormal"> Add condition checking of residuals because it may be NULL.<o:p></o:p></p>
<p class="MsoNormal"> Change printf data structure and remove old code.<o:p></o:p></p>
<p class="MsoNormal"> Add PrintfLog structure.<o:p></o:p></p>
<p class="MsoNormal"> Reconstruct printf parser.<o:p></o:p></p>
<p class="MsoNormal"> Add LLVM fcuntion definition of printf.<o:p></o:p></p>
<p class="MsoNormal"> Add tuple processing logic for printf.<o:p></o:p></p>
<p class="MsoNormal"> Add the implementation of printf ir instruction.<o:p></o:p></p>
<p class="MsoNormal"> Implement emision of printf instruction.<o:p></o:p></p>
<p class="MsoNormal"> Implement instruction selection of printf.<o:p></o:p></p>
<p class="MsoNormal"> Implement ASM generation of printf.<o:p></o:p></p>
<p class="MsoNormal"> Implement printf buffer management.<o:p></o:p></p>
<p class="MsoNormal"> Output printf result.<o:p></o:p></p>
<p class="MsoNormal"> Scalarize vector in printf.<o:p></o:p></p>
<p class="MsoNormal"> Remove unncessary assertion in printf processing.<o:p></o:p></p>
<p class="MsoNormal"> Add cl_khr_3d_image_writes into info string.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Yang Rong (48):<o:p></o:p></p>
<p class="MsoNormal"> Bump master version to 1.2.<o:p></o:p></p>
<p class="MsoNormal"> Update Release 1.1.0 NEWS.mdwn.<o:p></o:p></p>
<p class="MsoNormal"> Utest: fix a builtin_powr_float fail when OCL_STRICT_CONFORMANCE=0.<o:p></o:p></p>
<p class="MsoNormal"> Fix piglit clLinkProgram fail.<o:p></o:p></p>
<p class="MsoNormal"> Don't use cl_buffer_get_subdata in clEnqueueReadBuffer.<o:p></o:p></p>
<p class="MsoNormal"> Fix clLinkProgram error.<o:p></o:p></p>
<p class="MsoNormal"> Update NEWS.<o:p></o:p></p>
<p class="MsoNormal"> Revert "GBE: refine longjmp checking."<o:p></o:p></p>
<p class="MsoNormal"> GBE: use opencl c to implement llvm.memset and llvm.memcpy.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Add llvm3.7 support.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Move createStripAttributesPass before createInstructionCombiningPass.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Add datalayout and triple to ll files.<o:p></o:p></p>
<p class="MsoNormal"> fix llvm3.7 compiler_function_qualifiers utest fail.<o:p></o:p></p>
<p class="MsoNormal"> Libocl: forgot to add memset.h.<o:p></o:p></p>
<p class="MsoNormal"> Utest: fix random assert in function cl_kernel_link.<o:p></o:p></p>
<p class="MsoNormal"> LibOcl: Fix float convert to long/ulong bug.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: add CL_DEVICE_SPIR_VERSIONS to clGetDeviceInfo.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: return the correct error code in cl_event_check_waitlist.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: because double's built-ins haven't completely support, so disable it by default.<o:p></o:p></p>
<p class="MsoNormal"> GBE: fix a assert when structure argument's first field don't used.<o:p></o:p></p>
<p class="MsoNormal"> SKL: use the hw defautl value mocs index before linux 4.3.<o:p></o:p></p>
<p class="MsoNormal"> Android: change the saved file path.<o:p></o:p></p>
<p class="MsoNormal"> Android: erase the stl in iterator loop, must update the iterator.<o:p></o:p></p>
<p class="MsoNormal"> Android: derived the Allocator from std::allocator.<o:p></o:p></p>
<p class="MsoNormal"> Android: add android mk files.<o:p></o:p></p>
<p class="MsoNormal"> Android: fix __thread keyword issue in android.<o:p></o:p></p>
<p class="MsoNormal"> Android: disable pch in android.<o:p></o:p></p>
<p class="MsoNormal"> Android: workaround libdrm flags.<o:p></o:p></p>
<p class="MsoNormal"> Android: fix vector16 error in android.<o:p></o:p></p>
<p class="MsoNormal"> Changed ldexp to ldexpf when defining float min/max.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Use uanme to get kernel architecture.<o:p></o:p></p>
<p class="MsoNormal"> GBE: fix a patch JMPI assert.<o:p></o:p></p>
<p class="MsoNormal"> CMake: Fix a cmake warning.<o:p></o:p></p>
<p class="MsoNormal"> CMake: use CHECK_LIBRARY_EXISTS to check the function instead of version.<o:p></o:p></p>
<p class="MsoNormal"> GBE: fix a memset typo.<o:p></o:p></p>
<p class="MsoNormal"> GBE: fix caffe fft tests fail.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: fix caffe segmentation fault when exit.<o:p></o:p></p>
<p class="MsoNormal"> GBE: change GEN binary format.<o:p></o:p></p>
<p class="MsoNormal"> GBE: warning when the GEN binary version mismatch.<o:p></o:p></p>
<p class="MsoNormal"> GBE: reorder the condition to avoid array overflow.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: set the sub slice according to kernel pooled EU configure.<o:p></o:p></p>
<p class="MsoNormal"> README: remove "legacy Illegal pointer issue" section.<o:p></o:p></p>
<p class="MsoNormal"> FindLLVM: allow LLVM/Clang 3.8 and reorder the llvm-config priority.<o:p></o:p></p>
<p class="MsoNormal"> KBL: add kabylake pciids.<o:p></o:p></p>
<p class="MsoNormal"> KBL: add kabylake backend support.<o:p></o:p></p>
<p class="MsoNormal"> KBL: add kabylake runtime support.<o:p></o:p></p>
<p class="MsoNormal"> Docs: update readme.<o:p></o:p></p>
<p class="MsoNormal"> Bump to version 1.2.0.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Yang, Rong R (5):<o:p></o:p></p>
<p class="MsoNormal"> GBE: remove stacksize 64KB limitation.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: fix a userptr bug.<o:p></o:p></p>
<p class="MsoNormal"> GetGenID: add the miss pci ids.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: fix a string overflow.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add assert of pthread_getspecific.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Zhenyu Wang (2):<o:p></o:p></p>
<p class="MsoNormal"> First reference beignet's CL header to build<o:p></o:p></p>
<p class="MsoNormal"> Flush kernel source dump stream<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Zhigang Gong (37):<o:p></o:p></p>
<p class="MsoNormal"> runtime: always try to update event status in clGetEventProfilingInfo().<o:p></o:p></p>
<p class="MsoNormal"> GBE: fix the broken image_1d_buffer write.<o:p></o:p></p>
<p class="MsoNormal"> utests: refine image 1d buffer test case.<o:p></o:p></p>
<p class="MsoNormal"> GBE: one minor bug in OP_SIMD_XXX.<o:p></o:p></p>
<p class="MsoNormal"> GBE: a potential bug in instruction scheduling.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Use addRemappedFile to avoid creating temporary cl source file.<o:p></o:p></p>
<p class="MsoNormal"> GBE: fix build error with LLVM 3.5 and previous version.<o:p></o:p></p>
<p class="MsoNormal"> GBE: refactor curbe register allocation.<o:p></o:p></p>
<p class="MsoNormal"> GBE: refine longjmp checking.<o:p></o:p></p>
<p class="MsoNormal"> GBE: don't treat btiUtil as a curbe payload register.<o:p></o:p></p>
<p class="MsoNormal"> GBE: don't always allocate ir::ocl::one/zero<o:p></o:p></p>
<p class="MsoNormal"> GBE: we no longer need to allocate register from two directions.<o:p></o:p></p>
<p class="MsoNormal"> GBE: refine longjmp checking.<o:p></o:p></p>
<p class="MsoNormal"> GBE: refine Phi copy interfering check.<o:p></o:p></p>
<p class="MsoNormal"> GBE: refine liveness analysis.<o:p></o:p></p>
<p class="MsoNormal"> GBE: add two helper routines for liveness partially update.<o:p></o:p></p>
<p class="MsoNormal"> GBE: add some dag helper routines to check registers' interfering.<o:p></o:p></p>
<p class="MsoNormal"> GBE: implement further phi mov optimization based on intra-BB interefering analysis.<o:p></o:p></p>
<p class="MsoNormal"> GBE: continue to refine interfering check.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Don't try to remove instructions when liveness is in dynamic update phase.<o:p></o:p></p>
<p class="MsoNormal"> GBE: enable post phi copy optimization function.<o:p></o:p></p>
<p class="MsoNormal"> GBE: avoid vector registers when there is high register pressure.<o:p></o:p></p>
<p class="MsoNormal"> GBE: fix a zero/one's liveness bug.<o:p></o:p></p>
<p class="MsoNormal"> GBE: fix kernel arguments uploading bug.<o:p></o:p></p>
<p class="MsoNormal"> GBE: fix a regression bug at post phi copy optimization.<o:p></o:p></p>
<p class="MsoNormal"> GBE: extent register allocator size/offset to 32bit.<o:p></o:p></p>
<p class="MsoNormal"> GBE: don't assert even if we fail to compile kernel at the backend stage.<o:p></o:p></p>
<p class="MsoNormal"> GBE: remove useless assertions code.<o:p></o:p></p>
<p class="MsoNormal"> GBE: decrease the loop unrolling threshold to 640.<o:p></o:p></p>
<p class="MsoNormal"> runtime: set CL_KERNEL_PREFERRED_WORK_GROUP_SIZE_MULTIPLE to kernel's SIMD_WIDTH.<o:p></o:p></p>
<p class="MsoNormal"> GBE: implement pre-register-allocation instruction scheduling.<o:p></o:p></p>
<p class="MsoNormal"> Revert "GBE: disable mad for some cases."<o:p></o:p></p>
<p class="MsoNormal"> Refine custom unrolling policy.<o:p></o:p></p>
<p class="MsoNormal"> GBE: disable the read byte as DW.<o:p></o:p></p>
<p class="MsoNormal"> Android: work around a LLVM 3.5 unrolling bug.<o:p></o:p></p>
<p class="MsoNormal"> Remove nonexisting unit test cases in Android.mk.<o:p></o:p></p>
<p class="MsoNormal"> update android version.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
</body>
</html>