תמיכה בערכי נקודה צפה (floating-point) של 16 ביט ב-WGSL
ב-WGSL, הסוג f16 הוא קבוצת הערכים של נקודה צפה בגודל 16 ביט בפורמט binary16 (חצי דיוק) של IEEE-754. המשמעות היא שהיא משתמשת ב-16 ביטים כדי לייצג מספר נקודה צפה, בניגוד ל-32 ביטים עבור נקודה צפה רגילה עם דיוק יחיד (f32). הגודל הקטן יותר הזה יכול להוביל לשיפורים משמעותיים בביצועים, במיוחד כשמעבדים כמויות גדולות של נתונים.
לשם השוואה, במכשיר Apple M1 Pro, ההטמעה של f16 מודלים של Llama2 7B שנעשה בה שימוש בהדגמה של צ'אט WebLLM מהירה משמעותית מההטמעה של f32, עם שיפור של 28% במהירות המילוי המקדים ושיפור של 41% במהירות הפענוח, כפי שמוצג בצילומי המסך הבאים.
f32 (מימין) ו-f16 (משמאל).לא כל המעבדים הגרפיים תומכים בערכים של נקודה צפה (floating-point) של 16 ביט. אם התכונה "shader-f16" זמינה ב-GPUAdapter, עכשיו אפשר לבקש GPUDevice עם התכונה הזו וליצור מודול הצללה של WGSL שמנצל את סוג הנקודה הצפה בחצי דיוק f16. אפשר להשתמש בסוג הזה במודול של WGSL shader רק אם מפעילים את התוסף f16 WGSL באמצעות enable f16;. אחרת, הפונקציה createShaderModule() תיצור שגיאת אימות. אפשר לעיין בדוגמה המינימלית הבאה ובבעיה dawn:1510.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
requiredFeatures: ["shader-f16"],
});
const code = `
enable f16;
@compute @workgroup_size(1)
fn main() {
const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
}
`;
const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...
אפשר לתמוך גם בסוגים f16 וגם בסוגים f32 בקוד של מודול ההצללה של WGSL באמצעות alias, בהתאם לתמיכה בתכונה "shader-f16", כמו שמוצג בקטע הקוד הבא.
const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");
const device = await adapter.requestDevice({
requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});
const header = hasShaderF16
? `enable f16;
alias min16float = f16;`
: `alias min16float = f32;`;
const code = `
${header}
@compute @workgroup_size(1)
fn main() {
const c = vec3<min16float>(1.0, 2.0, 3.0);
}
`;
ללכת עד הקצה
מספר הבייטים המקסימלי שנדרש כדי להכיל דגימה אחת (פיקסל או תת-פיקסל) של נתוני פלט של צינור העיבוד, בכל מצורפי הצבעים, הוא 32 בייטים כברירת מחדל. עכשיו אפשר לבקש עד 64 באמצעות המגבלה maxColorAttachmentBytesPerSample. אפשר לעיין בדוגמה הבאה ובבעיה dawn:2036.
const adapter = await navigator.gpu.requestAdapter();
if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
// When the desired limit isn't supported, take action to either fall back to
// a code path that does not require the higher limit or notify the user that
// their device does not meet minimum requirements.
}
// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});
המגבלות maxInterStageShaderVariables ו-maxInterStageShaderComponents שמשמשות לתקשורת בין שלבים הוגדלו בכל הפלטפורמות. פרטים נוספים מופיעים בבעיה dawn:1448.
בכל שלב של הצללה, מספר הרשומות המקסימלי בפריסת קבוצת האיגוד בפריסת צינור, שהן מאגרי אחסון, הוא 8 כברירת מחדל. מעכשיו אפשר לבקש עד 10 משתמשים באמצעות המגבלה maxStorageBuffersPerShaderStage. מידע נוסף
נוספה מגבלה חדשה של maxBindGroupsPlusVertexBuffers. הוא מורכב מהמספר המקסימלי של משבצות של קבוצות קשירה ומאגרי קודקודים שנעשה בהם שימוש בו-זמנית, כולל משבצות ריקות מתחת לאינדקס הגבוה ביותר. ערך ברירת המחדל הוא 24. מידע נוסף
שינויים במצב סטנסיל עומק
כדי לשפר את חוויית המפתחים, כבר לא תמיד נדרשים המאפיינים depthWriteEnabled ו-depthCompare של מצב השבלונה של העומק: המאפיין depthWriteEnabled נדרש רק לפורמטים עם עומק, והמאפיין depthCompare לא נדרש לפורמטים עם עומק אם לא נעשה בו שימוש בכלל. מידע נוסף
עדכונים במידע של מתאמים
עכשיו אפשר לקבל מאפייני מידע של מתאמים לא סטנדרטיים type ו-backend באמצעות קריאה ל-requestAdapterInfo() אם המשתמש הפעיל את הדגל 'תכונות למפתחים של WebGPU' בכתובת chrome://flags/#enable-webgpu-developer-features. הערך של type יכול להיות 'discrete GPU', 'integrated GPU', 'CPU' או 'unknown'. הערך של backend הוא WebGPU, D3D11, D3D12, metal, vulkan, openGL, openGLES או null. מידע נוסף
הפרמטר האופציונלי unmaskHints list ב-requestAdapterInfo() הוסר. מידע נוסף
קוונטיזציה של שאילתות שכוללות חותמות זמן
שאילתות של חותמות זמן מאפשרות לאפליקציות למדוד את זמן הביצוע של פקודות GPU ברמת דיוק של ננו-שנייה. עם זאת, מפרט WebGPU קובע ששאילתות של חותמות זמן הן אופציונליות בגלל חששות לגבי מתקפות תזמון. צוות Chrome מאמין שכימות של שאילתות חותמות זמן מספק פשרה טובה בין דיוק לאבטחה, כי הוא מקטין את הרזולוציה ל-100 מיקרו-שניות. מידע נוסף
ב-Chrome, המשתמשים יכולים להשבית את הכמות של חותמות הזמן על ידי הפעלת הדגל 'תכונות למפתחים של WebGPU' ב-chrome://flags/#enable-webgpu-developer-features. שימו לב שהדגל הזה לבדו לא מפעיל את התכונה "timestamp-query". ההטמעה שלו עדיין ניסיונית, ולכן נדרש הדגל Unsafe WebGPU Support (תמיכה לא בטוחה ב-WebGPU) בכתובת chrome://flags/#enable-unsafe-webgpu.
ב-Dawn, נוסף מתג מכשיר חדש בשם timestamp_quantization, שמופעל כברירת מחדל. בקטע הקוד הבא אפשר לראות איך מאפשרים את התכונה הניסיונית timestamp-query בלי כימות של חותמת הזמן כשמבקשים מכשיר.
wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};
const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;
const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = ×tampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;
wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};
// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);
תכונות של ניקיון כללי
התכונה הניסיונית timestamp-query-inside-passes קיבלה את השם החדש chromium-experimental-timestamp-query-inside-passes כדי להבהיר למפתחים שהתכונה הזו ניסיונית וזמינה כרגע רק בדפדפנים שמבוססים על Chromium. מידע נוסף
התכונה הניסיונית pipeline-statistics-query, שההטמעה שלה הייתה חלקית בלבד, הוסרה כי הפיתוח שלה הופסק. מידע נוסף
המידע הזה כולל רק נקודות עיקריות. רשימה מלאה של קומיטים
מה חדש ב-WebGPU
רשימה של כל הנושאים שמופיעים בסדרת המאמרים מה חדש ב-WebGPU.
Chrome 143
Chrome 142
Chrome 141
- התאמת גוון IR הושלמה
- ניתוח טווח מספרים שלמים בקומפיילר WGSL
- עדכון SPIR-V 1.4 לבק-אנד ב-Vulkan
- עדכונים של Dawn
Chrome 140
- בקשות ממכשירים צורכות מתאם
- קיצור דרך לשימוש בטקסטורה במקום שבו נעשה שימוש בתצוגת טקסטורה
- הפונקציה textureSampleLevel ב-WGSL תומכת בטקסטורות חד-ממדיות
- הוצאה משימוש של השימוש בטקסטורות של אחסון לקריאה בלבד בפורמט bgra8unorm
- הסרת המאפיין isFallbackAdapter של GPUAdapter
- עדכונים של Dawn
Chrome 139
- תמיכה בטקסטורות תלת-ממדיות בפורמטים דחוסים של BC ו-ASTC
- תכונה חדשה: core-features-and-limits
- גרסת מקור לניסיון של מצב תאימות של WebGPU
- עדכונים של Dawn
Chrome 138
- קיצור דרך לשימוש ב-buffer כמשאב מחייב
- שינויים בדרישות הגודל של מאגרי נתונים זמניים שמנופים בזמן היצירה
- דוח ארכיטקטורה של יחידות GPU מהזמן האחרון
- הוצאה משימוש של המאפיין isFallbackAdapter של GPUAdapter
- עדכונים של Dawn
Chrome 137
- שימוש בתצוגת טקסטורה לקישור externalTexture
- העתקת מאגרי נתונים זמניים בלי לציין היסטים וגודל
- WGSL workgroupUniformLoad משתמשת במצביע לפעולה אטומית
- המאפיין powerPreference של GPUAdapterInfo
- הסרת המאפיין compatibilityMode של GPURequestAdapterOptions
- עדכונים של Dawn
Chrome 136
- המאפיין isFallbackAdapter של GPUAdapterInfo
- שיפורים במשך הזמן לקימפול של Shader ב-D3D12
- שמירה והעתקה של תמונות בלוח הציור
- הסרת ההגבלות של מצב תאימות
- עדכונים של Dawn
Chrome 135
- אפשר לתת ליצור פריסת צינור עיבוד נתונים עם פריסת קבוצת כבילה null
- אפשר לתת לאזורי תצוגה לחרוג מגבולות יעדי הרינדור
- גישה קלה יותר למצב התאימות הניסיוני ב-Android
- הסרת המגבלה של maxInterStageShaderComponents
- עדכונים של Dawn
Chrome 134
- שיפור עומסי עבודה של למידת מכונה באמצעות תת קבוצות
- סוגים ניתנים לסינון של מרקם של מספרים ממשיים כבר לא ייתמכו בתור מרקמים שניתנים למיזוג
- עדכונים של Dawn
Chrome 133
- עוד פורמטים של unorm8x4-bgra ושל רכיב אחד לוורטקסים
- מתן אפשרות לבקש מגבלות לא ידועות עם ערך לא מוגדר
- שינויים בכללי התאמת משתנים של WGSL
- שיפורים בביצועים של WGSL עם discard
- שימוש ב-displaySize של VideoFrame לטקסטורות חיצוניות
- טיפול בתמונות עם כיוונים שאינם ברירת המחדל באמצעות copyExternalImageToTexture
- שיפור חוויית המפתחים
- הפעלת מצב תאימות באמצעות featureLevel
- ניקוי של תכונות ניסיוניות של תת-קבוצות
- הוצאה משימוש של המגבלה maxInterStageShaderComponents
- עדכונים של Dawn
Chrome 132
- שימוש בתצוגת הטקסטורה
- מיזוג של מרקמים מסוג מספר ממשי (float) ב-32 ביט
- המאפיין adapterInfo של GPUDevice
- הגדרת הקשר של לוח הציור בפורמט לא תקין גורמת לשגיאת JavaScript
- הגבלות על דוגמי טקסטורה מסננים
- ניסויים מורחבים בתתי-קבוצות
- שיפור חוויית המפתחים
- תמיכה ניסיונית בפורמטים של טקסטורות מנורמלות של 16 ביט
- עדכונים של Dawn
Chrome 131
- מרחקי חיתוך ב-WGSL
- GPUCanvasContext getConfiguration()
- לטיפוסים פרימיטיביים של נקודות וקווים אסור שתהיה הטיית עומק
- פונקציות מובנות לסריקה מסכמת של תת קבוצות
- תמיכה ניסיונית בקריאה לציורים מרובים בצורה עקיפה
- אפשרות קימפול "מתימטיקה בלבד" של מודול תוכנת הצללה (shader)
- הסרה של GPUAdapter requestAdapterInfo()
- עדכונים של Dawn
Chrome 130
- מיזוג של שני מקורות
- שיפורים במשך הזמן לקימפול של Shader ב-Metal
- הוצאה משימוש של requestAdapterInfo() של GPUAdapter
- עדכונים של Dawn
Chrome 129
Chrome 128
- התנסות עם תת-קבוצות
- הוצאה משימוש של הגדרת הטיית עומק לקווים ולנקודות
- הסתרת אזהרה בכלי הפיתוח לגבי שגיאה שלא נתפסה אם preventDefault
- WGSL interpolate sampling first and either
- עדכונים של Dawn
Chrome 127
- תמיכה ניסיונית ב-OpenGL ES ב-Android
- המאפיין info של GPUAdapter
- שיפורים ביכולת הפעולה ההדדית של WebAssembly
- שיפורים בשגיאות של מקודד הפקודות
- עדכונים של Dawn
Chrome 126
- הגדלת המגבלה של maxTextureArrayLayers
- אופטימיזציה של העלאת מאגרי נתונים זמניים בבק-אנד ב-Vulkan
- שיפורים במשך הזמן לקימפול של תוכנות הצללה (shader)
- מאגרי נתונים זמניים שנשלחים לצורכי פקודות צריכים להיות ייחודיים
- עדכונים של Dawn
Chrome 125
Chrome 124
- טקסטורות של אחסון לקריאה בלבד ולקריאה וכתיבה
- תמיכה בקובצי שירות (service workers) וב-workers משותפים
- מאפייני מידע חדשים של מתאמים
- תיקוני באגים
- עדכונים של Dawn
Chrome 123
- תמיכה בפונקציות מובנות של DP4a ב-WGSL
- פרמטרים של מצביעים ללא הגבלה ב-WGSL
- תהליך הוספה של סוכר תחבירי לביטול ההפניה למרכיבים ב-WGSL
- מצב נפרד של קריאה בלבד לאספקטים של סטנסיל ועומק
- עדכונים של Dawn
Chrome 122
- הרחבת פוטנציאל החשיפה באמצעות מצב תאימות (תכונה בפיתוח)
- הגדלת המגבלה של maxVertexAttributes
- עדכונים של Dawn
Chrome 121
- תמיכה ב-WebGPU ב-Android
- שימוש ב-DXC במקום ב-FXC לקימפול של shader ב-Windows
- שאילתות של חותמות זמן במעברים של חישוב ועיבוד
- נקודות כניסה שמוגדרות כברירת מחדל למודולים של תוכנת הצללה (shader)
- תמיכה ב-display-p3 כמרחב צבעים של GPUExternalTexture
- מידע של ערימות זיכרון (heaps)
- עדכונים של Dawn
Chrome 120
- תמיכה בערכי נקודה צפה (floating-point) של 16 ביט ב-WGSL
- בלבחון את גבולות האפשר
- שינויים במצב סטנסיל עומק
- עדכונים במידע של מתאמים
- קוונטיזציה של שאילתות שכוללות חותמות זמן
- תכונות של ניקיון כללי
Chrome 119
- מרקמים מסוג מספר ממשי (float) ב-32 ביט שאפשר לסנן
- פורמט ורטקסים unorm10-10-10-2
- פורמט טקסטורה rgb10a2uint
- עדכונים של Dawn
Chrome 118
- תמיכה ב-HTMLImageElement וב-ImageData ב-
copyExternalImageToTexture() - תמיכה ניסיונית בטקסטורות של אחסון לקריאה/כתיבה ולקריאה בלבד
- עדכונים של Dawn
Chrome 117
- לא הוגדר ערך למאגר זמני של ורטקסים
- ביטול ההגדרה של קבוצת קישור
- השבתת שגיאות מיצירת צינורות אסינכרוניים לעיבוד נתונים כשמכשיר אבד
- עדכונים על יצירת מודול תוכנת הצללה (shader) בייצוג SPIR-V
- שיפור חוויית המפתחים
- שמירת צינורות לעיבוד נתונים במטמון עם פריסה שנוצרה אוטומטית
- עדכונים של Dawn
Chrome 116
- WebCodecs integration
- המאפיין isFallbackAdapter של GPUAdapter
requestDevice() - הפעלה חלקה של סרטונים אם יש קריאה ל-
importExternalTexture() - התאמה למפרט
- שיפור חוויית המפתחים
- עדכונים של Dawn
Chrome 115
- תוספים נתמכים לשפת WGSL
- תמיכה ניסיונית ב-Direct3D 11
- קבלת GPU נפרד כברירת מחדל בהפעלה באמצעות מתח AC
- שיפור חוויית המפתחים
- עדכונים של Dawn
Chrome 114
- אופטימיזציה של JavaScript
- הפונקציה getCurrentTexture() בלוח ציור שלא הוגדר מקפיצה את הודעת השגיאה InvalidStateError
- עדכונים של WGSL
- עדכונים של Dawn