<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
{font-family:SimSun;
panose-1:2 1 6 0 3 1 1 1 1 1;}
@font-face
{font-family:"Cambria Math";
panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
{font-family:Calibri;
panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
{font-family:SimSun;
panose-1:2 1 6 0 3 1 1 1 1 1;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
{margin:0in;
margin-bottom:.0001pt;
font-size:11.0pt;
font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
{mso-style-priority:99;
color:#0563C1;
text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
{mso-style-priority:99;
color:#954F72;
text-decoration:underline;}
span.EmailStyle17
{mso-style-type:personal-compose;
font-family:"Calibri",sans-serif;
color:windowtext;}
.MsoChpDefault
{mso-style-type:export-only;}
@page WordSection1
{size:8.5in 11.0in;
margin:1.0in 1.25in 1.0in 1.25in;}
div.WordSection1
{page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="#0563C1" vlink="#954F72">
<div class="WordSection1">
<p class="MsoNormal">Beignet 1.3.0<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">========================<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Beignet version 1.3 has been released. This is a major release of Beignet. This release include lots of improvements. The most important one is complete OpenCL 2.0 support. From 6th generation Intel Core Processors, include Skylake, Kabylake
and Apollolake, OpenCL 2.0 support can be turned on or off with build. When OpenCL 2.0 support is turned on with build, Beignet complies with OpenCL 2.0 spec. For more OpenCL 2.0 information, please refer to the README. Another improvement is runtime driver’s
refinement. Beignet re-implement the event module and enqueue module, make them more modular and structured. Beignet supported more extensions, speeded up kernel compiling time and improved the performance in this release.<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">The highlighted improvements are as below:<o:p></o:p></p>
<p class="MsoNormal">1. OpenCL 2.0 support.<o:p></o:p></p>
<p class="MsoNormal">2. OpenCL event and enqueue module re-implement.<o:p></o:p></p>
<p class="MsoNormal">3. Other OpenCL runtime driver refine.<o:p></o:p></p>
<p class="MsoNormal">4. LLVM 3.9 support.<o:p></o:p></p>
<p class="MsoNormal">5. Extension cl_khr_gl_sharing support.<o:p></o:p></p>
<p class="MsoNormal">6. Extension intel_subgroups_short support. <o:p></o:p></p>
<p class="MsoNormal">7. Large kernel compiling speed up.<o:p></o:p></p>
<p class="MsoNormal">8. Register allocation improvement.<o:p></o:p></p>
<p class="MsoNormal">9. Bugs fix.<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Git tag: Release_v1.3.0<o:p></o:p></p>
<p class="MsoNormal">Gitweb URL: http://cgit.freedesktop.org/beignet<o:p></o:p></p>
<p class="MsoNormal">https://01.org/sites/default/files/beignet-1.3.0-source.tar.gz<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">md5sum: ff4b5f66fc66649aef883e5602d0a3b1 beignet-1.3.0-source.tar.gz<o:p></o:p></p>
<p class="MsoNormal">sha1sum: e77f7bcca16e3f19066a7335876b7ba3ffc3ee39 beignet-1.3.0-source.tar.gz<o:p></o:p></p>
<p class="MsoNormal">sha256sum: 63d98b4fe8fba3dbc0299d29fef84560625e5ac51b16b8fed453021d4afb5cd5 beignet-1.3.0-source.tar.gz<o:p></o:p></p>
<p class="MsoNormal">-----------------------------------------------------------------<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Changes since 1.2.0:<o:p></o:p></p>
<p class="MsoNormal">Armin K (1):<o:p></o:p></p>
<p class="MsoNormal"> buildsys: Use CMRT_LIBDIR instead of CMRT_LIBRARY_DIRS<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Chuanbo Weng (3):<o:p></o:p></p>
<p class="MsoNormal"> Runtime: re-enable cl_khr_gl_sharing with existing egl extension.<o:p></o:p></p>
<p class="MsoNormal"> rumtime: check all the extension id, not only BASE and OPT1.<o:p></o:p></p>
<p class="MsoNormal"> runtime: set cl_intel_motion_estimation as IVB specifc device extension.<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Giuseppe Bilotta (2):<o:p></o:p></p>
<p class="MsoNormal"> Fix shift-overflow warning<o:p></o:p></p>
<p class="MsoNormal"> toMB: use standard constant<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Guo Yejun (12):<o:p></o:p></p>
<p class="MsoNormal"> fix the condition to check if there are built-in kernels<o:p></o:p></p>
<p class="MsoNormal"> use OCL_MAP_BUFFER_GTT to map climage<o:p></o:p></p>
<p class="MsoNormal"> avoid too many messages when the driver could not find good values for local_size<o:p></o:p></p>
<p class="MsoNormal"> fix w of image when simulate image1dbuffer with image2d<o:p></o:p></p>
<p class="MsoNormal"> add another broxton pciid 0x5A85<o:p></o:p></p>
<p class="MsoNormal"> enlarge stack size for chv since its EU might be masked<o:p></o:p></p>
<p class="MsoNormal"> enlarge scratch size for bxt 0x5a85<o:p></o:p></p>
<p class="MsoNormal"> add bxt with pciid 0x1A84<o:p></o:p></p>
<p class="MsoNormal"> correct the kernel name<o:p></o:p></p>
<p class="MsoNormal"> add bxt with pciid 0x1A85<o:p></o:p></p>
<p class="MsoNormal"> change PCI_CHIP_BROXTON_P to PCI_CHIP_BROXTON_0 to unify the naming<o:p></o:p></p>
<p class="MsoNormal"> fix UNTYPED_WRITE function parameters for Gen75Encoder::UNTYPED_WRITE<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Guo, Yejun (21):<o:p></o:p></p>
<p class="MsoNormal"> fix build issue when HAS_BO_SET_SOFTPIN is false<o:p></o:p></p>
<p class="MsoNormal"> remove some redundant code for printf<o:p></o:p></p>
<p class="MsoNormal"> do not care dst for printf<o:p></o:p></p>
<p class="MsoNormal"> do not touch src1 when setting instruction header<o:p></o:p></p>
<p class="MsoNormal"> prepare gen9 sends binary format and enable the ASM dump for sends<o:p></o:p></p>
<p class="MsoNormal"> support sends (split send) for untyped write<o:p></o:p></p>
<p class="MsoNormal"> revert clCreateCommandQueue* from ocl2.0 back to 1.2 in utests<o:p></o:p></p>
<p class="MsoNormal"> move function setDPByteScatterGather into class GenEncoder<o:p></o:p></p>
<p class="MsoNormal"> add sends support for byte write<o:p></o:p></p>
<p class="MsoNormal"> disable CMRT as default, since no real case reported<o:p></o:p></p>
<p class="MsoNormal"> save host_ptr when create sub buffer from CL_MEM_ALLOC_HOST_PTR<o:p></o:p></p>
<p class="MsoNormal"> enable sends for skl<o:p></o:p></p>
<p class="MsoNormal"> refine code to change insn.extra.splitSend as encoder funtion parameter<o:p></o:p></p>
<p class="MsoNormal"> support sends for long write<o:p></o:p></p>
<p class="MsoNormal"> add sends for atomic operation, only for ocl 1.2<o:p></o:p></p>
<p class="MsoNormal"> refine code starting from header in typedwrite<o:p></o:p></p>
<p class="MsoNormal"> enable sends for typed write<o:p></o:p></p>
<p class="MsoNormal"> output more detail of GEN IR for workgroup op<o:p></o:p></p>
<p class="MsoNormal"> add sends support for oword/media block write<o:p></o:p></p>
<p class="MsoNormal"> enable sends to write SLM for workgroup op<o:p></o:p></p>
<p class="MsoNormal"> add sends support for printf<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Igor Gnatenko (1):<o:p></o:p></p>
<p class="MsoNormal"> Fix build with latest libdrm<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Jan Vesely (3):<o:p></o:p></p>
<p class="MsoNormal"> api: check kernel parameter before accessing it<o:p></o:p></p>
<p class="MsoNormal"> tests: Use python2 explicitly<o:p></o:p></p>
<p class="MsoNormal"> libocl: Provide specs required CL_VERSION macros<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Junyan He (51):<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add CL base object for all cl objects.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Apply CL base object to program.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Apply base object to cl_platform_id<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Apply base object to cl_device_id<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Apply base object ot cl_sampler.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Apply base object to cl_mem.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Apply base object to cl_event<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Apply base object to cl_context<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Apply base object to cl_command_queue.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Apply base_object to cl_kernel<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Apply base object to cl_accelerator_intel<o:p></o:p></p>
<p class="MsoNormal"> Add list operation to utils.<o:p></o:p></p>
<p class="MsoNormal"> Add WAIT_ON_COND and WAIT_ON_COND to base object.<o:p></o:p></p>
<p class="MsoNormal"> Delete all the verbose locks and use list to store CL objects.<o:p></o:p></p>
<p class="MsoNormal"> Add command queue's enqueue thread.<o:p></o:p></p>
<p class="MsoNormal"> Implement event related functions.<o:p></o:p></p>
<p class="MsoNormal"> Modify all event related functions using new event handle.<o:p></o:p></p>
<p class="MsoNormal"> Add ref check for CL object's validation.<o:p></o:p></p>
<p class="MsoNormal"> Fix bugs in utest for event.<o:p></o:p></p>
<p class="MsoNormal"> Add a multi-queue utest.<o:p></o:p></p>
<p class="MsoNormal"> Delete useless cl_thread files.<o:p></o:p></p>
<p class="MsoNormal"> Fix a bug for event error status.<o:p></o:p></p>
<p class="MsoNormal"> Fix a bug for double free of enqueueNativeKernel.<o:p></o:p></p>
<p class="MsoNormal"> Add error handle for command queue destroy.<o:p></o:p></p>
<p class="MsoNormal"> Delete useless event list in command queue struct.<o:p></o:p></p>
<p class="MsoNormal"> Add a helper function for all information get.<o:p></o:p></p>
<p class="MsoNormal"> Modify clGetEventInfo using cl_get_info_helper.<o:p></o:p></p>
<p class="MsoNormal"> Modify clGetPlatformInfo using cl_get_info_helper.<o:p></o:p></p>
<p class="MsoNormal"> Modify clGetKernelInfo using cl_get_info_helper.<o:p></o:p></p>
<p class="MsoNormal"> Modify clGetCommandQueueInfo using cl_get_info_helper.<o:p></o:p></p>
<p class="MsoNormal"> Modify clGetContextInfo using cl_get_info_helper.<o:p></o:p></p>
<p class="MsoNormal"> Modify clGetDeviceInfo using cl_get_info_helper.<o:p></o:p></p>
<p class="MsoNormal"> Modify clGetSamplerInfo using cl_get_info_helper.<o:p></o:p></p>
<p class="MsoNormal"> Modify program Info using cl_get_info_helper.<o:p></o:p></p>
<p class="MsoNormal"> Modify clGetMemObjectInfo using cl_get_info_helper.<o:p></o:p></p>
<p class="MsoNormal"> Modify clGetImageInfo using cl_get_info_helper.<o:p></o:p></p>
<p class="MsoNormal"> Add helper functions for device list check.<o:p></o:p></p>
<p class="MsoNormal"> Refine create context APIs.<o:p></o:p></p>
<p class="MsoNormal"> Add multi devices support in context.<o:p></o:p></p>
<p class="MsoNormal"> Refine clRetain/Release MemObject<o:p></o:p></p>
<p class="MsoNormal"> Refine clCreateSampler API.<o:p></o:p></p>
<p class="MsoNormal"> Refine retain/release sampler API<o:p></o:p></p>
<p class="MsoNormal"> refine clCreateCommandQueue and clRetainCommandQueue.<o:p></o:p></p>
<p class="MsoNormal"> Move Device related APIs to new file<o:p></o:p></p>
<p class="MsoNormal"> Move clCreateCommandQueueWithProperties API to command_queue file.<o:p></o:p></p>
<p class="MsoNormal"> Utest: Refine half and float convert functions.<o:p></o:p></p>
<p class="MsoNormal"> Refine list related functions.<o:p></o:p></p>
<p class="MsoNormal"> Add profiling feature based on new event implementation.<o:p></o:p></p>
<p class="MsoNormal"> Improve event execute function.<o:p></o:p></p>
<p class="MsoNormal"> Fix two bugs about event.<o:p></o:p></p>
<p class="MsoNormal"> Fix a event notify bug.<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Luo Xionghu (12):<o:p></o:p></p>
<p class="MsoNormal"> add atomic operators output for GEN_IR and gen disa.<o:p></o:p></p>
<p class="MsoNormal"> gbe: add AtomicA64 instructions with stateless access.<o:p></o:p></p>
<p class="MsoNormal"> support generic atomic.<o:p></o:p></p>
<p class="MsoNormal"> utest: add generic atomic test.<o:p></o:p></p>
<p class="MsoNormal"> cl_mem_fence_flags definiton change from MACRO to enum<o:p></o:p></p>
<p class="MsoNormal"> gbe: atomic_long type support.<o:p></o:p></p>
<p class="MsoNormal"> address bits change to 64.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add API clCreateCommandQueueWithProperties<o:p></o:p></p>
<p class="MsoNormal"> atomic_flag_test_and_set function fix.<o:p></o:p></p>
<p class="MsoNormal"> gbe: use kernel_arg_base_type to recognize image arguments.<o:p></o:p></p>
<p class="MsoNormal"> gbe: add vec_type_hint's type into functionAttributes.<o:p></o:p></p>
<p class="MsoNormal"> atomic bug fix.<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Mark Thompson (1):<o:p></o:p></p>
<p class="MsoNormal"> Apply image offset to read/write/map operations<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Meng Mengmeng (3):<o:p></o:p></p>
<p class="MsoNormal"> Runtime: return CL_INVALID_EVENT_WAIT_LIST if not event in the wait list.<o:p></o:p></p>
<p class="MsoNormal"> eliminate build warnings in i386 system.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Use cl_ulong as CL_DEVICE_MAX_MEM_ALLOC_SIZE's return type.<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Pan Xiuli (70):<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine block_read buffer with unaligned OWord block read<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add test for half type subgroup functions<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix printf bug for simd8<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Fix null device for clGetKernelWorkGroupInfo<o:p></o:p></p>
<p class="MsoNormal"> Libocl: Add define for cl_intel_subgroups<o:p></o:p></p>
<p class="MsoNormal"> Backend: Resize the selection instruction max dst num<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine image block read with less vector and dst tmp<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix simd id will broke in simd8 mode<o:p></o:p></p>
<p class="MsoNormal"> Utest: Fix sub group broadcast for simd8<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix simd shuffle base address<o:p></o:p></p>
<p class="MsoNormal"> Utest: Fix sub group shuffle for simd8<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix bug for sub/work group functions<o:p></o:p></p>
<p class="MsoNormal"> Libocl: Fix get_sub_group_size bug<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine gen ir ALU1 inst getType<o:p></o:p></p>
<p class="MsoNormal"> Utest: Change the kernel index to fit case index<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Fix accesss quilifer for internal kernels<o:p></o:p></p>
<p class="MsoNormal"> Libocl: Image should have access qualifier<o:p></o:p></p>
<p class="MsoNormal"> Utest: read/write_only qualifier should only used with image.<o:p></o:p></p>
<p class="MsoNormal"> Utest: Remove load spir test<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add support for LLVM 3.9 release<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine GenRegiter::offset<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine register offset for simd shuffle<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine sub group broadcast code for spec<o:p></o:p></p>
<p class="MsoNormal"> Libocl: Add sub group broadcast short builtin function<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add check subgroup short helper function<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add test case for sub group broadcast short<o:p></o:p></p>
<p class="MsoNormal"> Backend: Change the sel ir optimization for unpack register<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add short sub group builtin functions<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add test case for sub group short builtin functions<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add sub groups short shuffle builtin functions<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add test case for short type sub group shuffle<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add subgroup short block read/write<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add subgroup block read/write ushort test case<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add A64 subgroup block read/write support<o:p></o:p></p>
<p class="MsoNormal"> Libocl: Add intel_subgroups_short extension<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add built-in ctz function<o:p></o:p></p>
<p class="MsoNormal"> Utest: add a test case for built-in ctz function<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add clCreateSamplerWithProperties<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add sampler test<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add support of OCL2.0 device queries<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add extensions for OCL20<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add pipe related APIs<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add Pipe Builtin support<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add pipe packet size check<o:p></o:p></p>
<p class="MsoNormal"> Utest: Add pipe related test<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add support for sRGB<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Refine clGetSupportedImageFormats to support CL_MEM_FLAGS<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add suport for sRGB to clEnqueueCopyImage<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add suport for sRGB to clEnqueueFillImage<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add support for clGetMemObjectInfo<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine get_enqueued_local_size and get_local_size<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add support for non uniform group size<o:p></o:p></p>
<p class="MsoNormal"> Backend: Clang now support static, fix now<o:p></o:p></p>
<p class="MsoNormal"> libocl: Refine return type of workitem built-in functions<o:p></o:p></p>
<p class="MsoNormal"> Backend: Chang scan limit for GVN pass<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Add support for queue size and fix error handling<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add RegisterFamily for ir<o:p></o:p></p>
<p class="MsoNormal"> Backend: Initialize the extra value for selection instruction<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix GenRegister::offset sub reg offset<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine flag usage in instrction selection<o:p></o:p></p>
<p class="MsoNormal"> Backend: Add kernel name for sel ir output<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine instruction ID for sel ir<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine selection IR output<o:p></o:p></p>
<p class="MsoNormal"> Backend: Refine block read/write instruction selection<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix some A64 block read/write bug<o:p></o:p></p>
<p class="MsoNormal"> CMake: Add OCL20 env for utest<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix sel ir subnr usage<o:p></o:p></p>
<p class="MsoNormal"> Backend: Fix header address of oword block read/write<o:p></o:p></p>
<p class="MsoNormal"> GBE: Fix memdep-block-scan-limit caused bug on LLVM3.8<o:p></o:p></p>
<p class="MsoNormal"> GBE: Fix getTypesize bug with LLVM3.9<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Rebecca N. Palmer (10):<o:p></o:p></p>
<p class="MsoNormal"> Allow building tests with Python 3 (no string.atoi)<o:p></o:p></p>
<p class="MsoNormal"> Utest: test pow, not powr, on negative x<o:p></o:p></p>
<p class="MsoNormal"> Docs: Spelling and grammar fixes<o:p></o:p></p>
<p class="MsoNormal"> Utests: use clGetExtensionFunctionAddressForPlatform<o:p></o:p></p>
<p class="MsoNormal"> Utests: Don't end an all-tests run when one test fails<o:p></o:p></p>
<p class="MsoNormal"> Utests: respect existing C/CXXFLAGS<o:p></o:p></p>
<p class="MsoNormal"> Fix build failure with CMRT enabled<o:p></o:p></p>
<p class="MsoNormal"> Utests: Allow testing cl_intel_accelerator via ICD<o:p></o:p></p>
<p class="MsoNormal"> Add clGetKernelSubGroupInfoKHR to _cl_icd_dispatch table<o:p></o:p></p>
<p class="MsoNormal"> Fail, don't assert, if unable to create context<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Ruiling Song (25):<o:p></o:p></p>
<p class="MsoNormal"> GBE: add untyped A64 stateless message<o:p></o:p></p>
<p class="MsoNormal"> GBE: add byte scatter a64 message<o:p></o:p></p>
<p class="MsoNormal"> GBE: Add 64bit data stateless messages<o:p></o:p></p>
<p class="MsoNormal"> GBE: new Load/Store Instruction Selection pattern<o:p></o:p></p>
<p class="MsoNormal"> OCL20/GBE: Fix 64bit pointer issue in Load store instruction selection.<o:p></o:p></p>
<p class="MsoNormal"> ocl20/runtime: take the first 64KB page table entries.<o:p></o:p></p>
<p class="MsoNormal"> ocl20/GBE: support generic load/store<o:p></o:p></p>
<p class="MsoNormal"> utest: add generic pointer test<o:p></o:p></p>
<p class="MsoNormal"> GBE: Implement new constant solution for ocl2<o:p></o:p></p>
<p class="MsoNormal"> GBE: Implement to_local/private/global() function<o:p></o:p></p>
<p class="MsoNormal"> libocl: add get_fence() builtin.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Fix type mismatch bug.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Fix SEL.bool issue.<o:p></o:p></p>
<p class="MsoNormal"> GBE: add ocl 2.0 work_group_barrier support.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Fix bug when unspill a long type value from scratch.<o:p></o:p></p>
<p class="MsoNormal"> GBE: don't try to erase a llvm:Constant.<o:p></o:p></p>
<p class="MsoNormal"> GBE: the dst grf should use same width as source register<o:p></o:p></p>
<p class="MsoNormal"> GBE: retype double register to long type when do spilling.<o:p></o:p></p>
<p class="MsoNormal"> runtime: prog->global_data may get 64bit address<o:p></o:p></p>
<p class="MsoNormal"> GBE: imm64 should not be in src1 per hardware spec.<o:p></o:p></p>
<p class="MsoNormal"> GBE: handle ConstantExpr in program-scope variable handling.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Refine program scope variable logic.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Fix destination grf register type for cmp instruction.<o:p></o:p></p>
<p class="MsoNormal"> runtime: handle PROGRAM_BUILD_GLOBAL_VARIABLE_TOTAL_SIZE<o:p></o:p></p>
<p class="MsoNormal"> GBE: Fix another Sel.bool issue.<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Yan Wang (4):<o:p></o:p></p>
<p class="MsoNormal"> Fix bug: Initialize bti of LoadInstuctionPattern::shootByteGatherMsg().<o:p></o:p></p>
<p class="MsoNormal"> Fix getting bitwidth of PointerType of LLVM.<o:p></o:p></p>
<p class="MsoNormal"> Restore jump threading pass for reducing compiling time when run the large and complex kernel like Luxmark.<o:p></o:p></p>
<p class="MsoNormal"> Avoid possible invalid pointer by vector interator.<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Yang Rong (36):<o:p></o:p></p>
<p class="MsoNormal"> Docs: update readme.<o:p></o:p></p>
<p class="MsoNormal"> Bump version to 1.3.<o:p></o:p></p>
<p class="MsoNormal"> Docs: update a readme typo.<o:p></o:p></p>
<p class="MsoNormal"> GBE: fix uninitialized build warning.<o:p></o:p></p>
<p class="MsoNormal"> GBE: fix half immediate negate assert.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Fix assert when get metadata llvm.loop.unroll.enable.<o:p></o:p></p>
<p class="MsoNormal"> GBE: Fix a logical insn with flag bug.<o:p></o:p></p>
<p class="MsoNormal"> NEWS: Update Release 1.2.1.<o:p></o:p></p>
<p class="MsoNormal"> OCL20/GBE: Change the pointer relative op's type.<o:p></o:p></p>
<p class="MsoNormal"> OCL20: Add svm support.<o:p></o:p></p>
<p class="MsoNormal"> OCL20: Add OpenCL2.0 apis to icd.<o:p></o:p></p>
<p class="MsoNormal"> OCL20: add svm enqueue apis and svm's sub buffer support.<o:p></o:p></p>
<p class="MsoNormal"> OCL20: add gbe_kernel_get_ocl_version for getting kernel's version in runtime.<o:p></o:p></p>
<p class="MsoNormal"> libocl: change prototype of vload/vstore to match ocl2.0 spec.<o:p></o:p></p>
<p class="MsoNormal"> add opencl builtin atomic functions implementation.<o:p></o:p></p>
<p class="MsoNormal"> utest: add atomic opencl-2.0 case to test api.<o:p></o:p></p>
<p class="MsoNormal"> OCL20: Fix svm bugs<o:p></o:p></p>
<p class="MsoNormal"> OCL20: Implement clSetKernelExecInfo api<o:p></o:p></p>
<p class="MsoNormal"> Libocl: change prototype of math built-in for OCL2.0 spec<o:p></o:p></p>
<p class="MsoNormal"> OCL20: fix a unpack long assert.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Fix vme fail.<o:p></o:p></p>
<p class="MsoNormal"> Refine clSetMemObjectDestructorCallback API.<o:p></o:p></p>
<p class="MsoNormal"> GBE: reorder the LLVM pass to reduce the compilation time.<o:p></o:p></p>
<p class="MsoNormal"> GEB/Runtime: eliminate release build warnings.<o:p></o:p></p>
<p class="MsoNormal"> utest: suspend deprecated-declarations warning.<o:p></o:p></p>
<p class="MsoNormal"> Add the NULL pointer check.<o:p></o:p></p>
<p class="MsoNormal"> GBE: correct the llvm.loop.unroll.enable meta.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: add the head file to avoid implicit declaration of function ‘cl_devices_list_include_check’ warning.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: fix a profiling fail.<o:p></o:p></p>
<p class="MsoNormal"> utest: fix i386 system long ctz fail.<o:p></o:p></p>
<p class="MsoNormal"> GBE: fix long work group fail.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: Fix a event bug.<o:p></o:p></p>
<p class="MsoNormal"> GBE: if PointerFamily is FAMILY_QWORD, chv and bxt need special handle.<o:p></o:p></p>
<p class="MsoNormal"> GBE: fix legacy read64 mix pointer bug.<o:p></o:p></p>
<p class="MsoNormal"> GBE: fix a mix analyze bug.<o:p></o:p></p>
<p class="MsoNormal"> Add some pointer access check.<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Yang, Rong R (23):<o:p></o:p></p>
<p class="MsoNormal"> KBL: fix some 1d array test fail.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: avoid clang warning "warning: expression result unused".<o:p></o:p></p>
<p class="MsoNormal"> Add new BXT and KBL pciids to GetGenID.sh.<o:p></o:p></p>
<p class="MsoNormal"> GBE: fix ctz fail.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: fix clEnqueueMigrateMemObjects fail.<o:p></o:p></p>
<p class="MsoNormal"> GBE: don't use call->getCalledFunction() to decide the materialize function.<o:p></o:p></p>
<p class="MsoNormal"> GBE: remove image type's access qual from image type name.<o:p></o:p></p>
<p class="MsoNormal"> Runtime: fix fill image event assert and some SVM rebase error.<o:p></o:p></p>
<p class="MsoNormal"> OCL20: Add read_write image type of image apis.<o:p></o:p></p>
<p class="MsoNormal"> OCL20: add beignet_20.pch and beignet_20.bc.<o:p></o:p></p>
<p class="MsoNormal"> OCL20: Add __OPENCL_VERSION__ and CL_VERSION_2_0 define.<o:p></o:p></p>
<p class="MsoNormal"> OCL20: enable -cl-std=CL2.0.<o:p></o:p></p>
<p class="MsoNormal"> OCL20: Add generic address space memcpy and memset.<o:p></o:p></p>
<p class="MsoNormal"> GBE: fix a src/dst register reuse bug.<o:p></o:p></p>
<p class="MsoNormal"> OCL20: add device enqueue helper functions in backend.<o:p></o:p></p>
<p class="MsoNormal"> OCL20: add device enqueue builtins.<o:p></o:p></p>
<p class="MsoNormal"> OCL20: add ir register enqueuebufptr for enqueue global buffer.<o:p></o:p></p>
<p class="MsoNormal"> OCL20: handle device enqueue helper functions in the backend.<o:p></o:p></p>
<p class="MsoNormal"> OCL20: Add runtime functions to get the device enqueue info.<o:p></o:p></p>
<p class="MsoNormal"> OCL20: add a cl_kernel pointer to gpgpu.<o:p></o:p></p>
<p class="MsoNormal"> OCL20: handle device enqueue in runtime.<o:p></o:p></p>
<p class="MsoNormal"> OCL20: add device enqueue test case.<o:p></o:p></p>
<p class="MsoNormal"> CMake: add an option to enable OpenCL 2.0.<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p></p>
<p class="MsoNormal">Zhigang Gong (1):<o:p></o:p></p>
<p class="MsoNormal"> CL: update to 2.0 header files.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
</body>
</html>