divmagic Make design
SimpleNowLiveFunMatterSimple
די איניציאטיוו פון מייקראָסאָפֿט צו ראַנג אַי מאָדעלס דורך זיכערקייַט: אַ פולשטענדיק איבערבליק
Author Photo
Divmagic Team
June 9, 2025

Microsoft ס איניציאטיוו צו ראַנג אַי מאָדעלס דורך זיכערקייַט: אַ פולשטענדיק איבערבליק

אין יוני 2025, מייקראָסאָפֿט מודיע אַ באַטייַטיק פראַנסער אין קינסטלעך סייכל (אַי) זיכערקייַט דורך ינטראָודוסינג אַ "זיכערקייַט" קאַטעגאָריע צו זיין יי מאָדעל. דעם איניציאטיוו יימז צו צושטעלן קלאָוד קאַסטאַמערז מיט טראַנספּעראַנט און אָביעקטיוו מעטריקס, אַלאַוינג זיי צו מאַכן ינפאָרמד דיסיזשאַנז ווען סעלעקטינג AI מאָדעלס.

די נויט פֿאַר אַי זיכערקייַט ראַנגקינגז

אַדרעסינג גראָוינג קאַנסערנז אין AI דיפּלוימאַנט

ווי יי טעקנאַלאַדזשיז ווערן ינקריסינגלי ינאַגרייטיד אין פאַרשידן סעקטאָרס, קאַנסערנז וועגן זייער זיכערקייַט און עטישע ימפּלאַקיישאַנז האָבן געשטארקט. ינסטאַנסיז פון אַי-דזשענערייטאַד אינהאַלט קאָזינג שאָדן אָדער פאַרשפּרייטן מיסאַפפאָרמאַנט אונטער די נייטיקייט פֿאַר געזונט זיכערקייַט מיטלען. מייקראָסאָפֿט ס מאַך צו ראַנג אַי מאָדעלס פון זיכערקייַט איז אַ פּראָואַקטיוו שריט צו מיטאַגייטינג די ריסקס.

ענכאַנסינג צוטרוי צווישן וואָלקן קאַסטאַמערז

פֿאַר וואָלקן דינסט פּראַוויידערז ווי מייקראָסאָפֿט, פאָסטערינג צוטרוי איז העכסט. דורך ימפּלאַמענינג זיכערקייַט ראַנגקינגז, מייקראָסאָפֿט דעמאַנסטרייץ זייַן היסכייַוועס צו פאַראַנטוואָרטלעך יי דיפּלוימאַנט, אַשורינג קאַסטאַמערז אַז די יי מאָדעלס קענען נוצן אַדכיר צו הויך זיכערקייַט סטאַנדאַרדס.

מייקראָסאָפֿט ס זיכערהייט ראַנגקינג מעטאַדאַלאַדזשי

# הקדמה פון די זיכערקייַט קאַטעגאָריע

Microsoft ס יי מאָדעל לעאַדערבאָאַרד, ביז אַהער עוואַלואַטירן מאָדעלס באזירט אויף קוואַליטעט, קאָסטן און טרופּוט, וועט איצט ינקאָרפּערייט אַ זיכערקייט מעטריק. דער אַדישאַן יימז צו צושטעלן אַ האָליסטיק אַסעסמאַנט פון אַי מאָדעלס, קאַנסידערינג ניט בלויז זייער פאָרשטעלונג און עפעקטיווקייַט אָבער אויך זייער זיכערקייַט פּראָפילעס.

יוטאַלאַזיישאַן פון טאָקסיגען און צענטער פֿאַר אַי סאַפעשאַטערז

To assess the safety of AI models, Microsoft will employ its proprietary ToxiGen benchmark, which evaluates implicit hate speech, and the Center for AI Safety's benchmark, focusing on potential misuse for dangerous activities like creating biochemical weapons. (ft.com)

ימפּלאַקיישאַנז פֿאַר די AI אינדוסטריע

באַשטעטיקן אינדוסטריע סטאַנדאַרדס פֿאַר אַי זיכערקייַט

מייקראָסאָפֿט ס איניטיאַטיוו איז גרייט צו שטעלן אַ פּרעסידאַנט פֿאַר אַי זיכערקייַט סטאַנדאַרדס. לויט עפנטלעך קוויטל מאָדעלס באזירט אויף זיכערקייַט, מייקראָסאָפֿט ינקעראַדזשאַז אנדערע אָרגאַנאַזיישאַנז צו אַדאַפּט ענלעך פּראַקטיסיז, פאָסטערינג אַ קולטור פון פֿאַראַנטוואָרטלעכקייט אין די AI קהל.

פּראַל אויף אַי מאָדעל פּראַוויידערז

אַי מאָדעל פּראַוויידערז וועט דאַרפֿן צו ענשור אַז זייער מאָדעלס טרעפן מייקריסאָפט ס זיכערקייַט קרייטיריאַ צו בלייַבן קאַמפּעטיטיוו. דאָס קען פירן צו געוואקסן ינוועסמאַנט אין זיכערקייַט מיטלען און דורכזעיקייַט, לעסאָף נוץ סוף-ניצערס.

מייקראָסאָפֿט ס היסכייַוועס צו פאַראַנטוואָרטלעך יי

ינאַגריישאַן פון זיכערקייַט פֿעיִקייטן אין אַזורע יי

מייקראָסאָפֿט איז ינאַגרייטינג זיכערקייַט פֿעיִקייטן אין זיין אַזורע יי פּלאַטפאָרמע, אַרייַנגערעכנט:

  • פּינטלעך שילדז: דיזיינד צו פאַרמייַדן שעדלעך פּראַמפּס אָדער ינדזשעקשאַנז פון פונדרויסנדיק קוואלן וואָס קען פירן יי מאָדעלס ווערן פארבלאנדזשעט. (theverge.com)

  • גראַונדעדנאַס דיטעקשאַן: פאָוקיסיז אויף ידענטיפיינג און מיטאַגייטינג כאַלוסאַניישאַנז אין די AI סיסטעם. (theverge.com)

  • זיכערקייַט יוואַליויישאַנז: אַלאַוז ניצערס צו אַססעסס וואַלנעראַביליטיז אין זייער מאָדעלס און נעמען נויטיק פּריקאָשאַנז. (theverge.com)

מיטאַרבעט מיט רעגולאַטאָרי ללבער

מייקראָסאָפֿט ס פּראָוטיווע צוגאַנג כולל מיטאַרבעט מיט רעגולאַטאָרי ללבער צו ענשור העסקעם מיט גלאבאלע אַי זיכערהייט סטאַנדאַרדס. דעם באַשטעלונג ריפלעקס מיקראָסאָפט ס דעדיקאַציע צו פאַראַנטוואָרטלעך יי דיפּלוימאַנט און זייַן ראָלע אין פורעמונג אינדוסטריע רעגיאַליישאַנז. (microsoft.com)

טשאַלאַנדזשיז און קאַנסידעריישאַנז

באַלאַנסינג פאָרשטעלונג און זיכערקייַט

בשעת זיכערקייַט איז העכסט פּאַראַמאָונט, עס איז יקערדיק צו וואָג עס מיט דער פאָרשטעלונג און עפעקטיווקייַט פון אַי מאָדעלס. אָווערעמפאַסיס אויף זיכערקייַט קען פּאַטענטשאַלי שטערן כידעש אָדער פירן צו צו ריסטריקטיוו מאָדעלס. דעריבער, אַ Nuanced צוגאַנג איז נייטיק צו טייַנען דעם וואָג.

קעסיידערדיק מאָניטאָרינג און אפשאצונג

אַי מאָדעלס און זייער אַפּלאַקיישאַנז זענען קאַנטיניולי יוואַלווינג. אָנגאָינג מאָניטאָרינג און אפשאצונג זענען קריטיש צו ענשור אַז זיכערקייַט סטאַנדאַרדס בלייַבן באַטייַטיק און עפעקטיוו אין מיטאַגייטינג ימערדזשינג ריסקס.

מסקנא

Microsoft ס איניציאטיוו צו רייען אַי מאָדעלס דורך זיכערקייַט רעפּראַזענץ אַ באַטייַטיק אַדוואַנסער אין פאַראַנטוואָרטלעך ייפּלוימאַנט. דורך פּראַוויידינג טראַנספּעראַנט זיכערקייַט מעטריקס, מייקראָסאָפֿט ימפּאַוערז וואָלקן קאַסטאַמערז צו מאַכן ינפאָרמד דיסיזשאַנז, פאָסטערס אינדוסטריע-ברייט סטאַנדאַרדס, און אַנדערסקאָרז זייַן היסכייַוועס.

Microsoft ס יי זיכערקייַט ינישאַטיווז און אינדוסטריע פּראַל:

טאַגס
מייקראָסאָפֿטאַי זיכערקייַטאַז איר האָטפאַראַנטוואָרטלעך ייאַי מאָדעלס
Blog.lastUpdated
: June 9, 2025

Social

תּנאָים & פּאַלאַסיז

© 2025. כל הזכויות שמורות.