DeepSeek: AI סיני שמפחיד את הענקים האמריקאים

סערה בעולם הקטן של AI הגנרי. צ'ט -בוט סיני לא ידוע, Deepseek, התנפץ בראש דירוג חנות האפליקציות בטכנולוגיית קוד פתוח שהפיתוח שלה עלה 6 מיליון דולר ... לתוצאות קרוב לאלה של ChatGpt.

זה פאניקה באמצע ה- AI האמריקני, A "רגע ספוטניק"דְאָגָהמארק אנדרסן, המשקיע והיועץ הקרוב של דונלד טראמפ, בהתייחס לוויין הראשון ששיקתה ברית המועצות בשנת 1957, אשר לקצר את ארצות הברית. צ'אט בוט סיני,DeepSeekבימים האחרונים בראש סיווג היישומים החינמיים הפופולריים ביותר בכל העולם.

דייוויד נגד גוליית

מודל השפה המתקדם ביותר (LLM) שהוצע על ידי הבוט, DeepSeek-R1, היה טוב יותר מ, על בעיות מתמטיקה והנמקה, על פי מדדים שנעשו על ידי Deepseek. כברירת מחדל, ה- ChatBot עובד עם Deepseek-V3, שהיה עולה פחות מ -6 מיליון דולר לפיתוח. טיפת מים במאות מיליארדים הנחוצים לעיצוב LLM בעל ביצועים גבוהים, נזכרים ללא הרף בענקיות האמריקאיות של התחום - דרך פרויקט סטארגייט, למשל.

Lire

ל- Deepseek יש את הצד הקטן הזה של דייוויד גולית גוליית שיכול לטלטל את הוודאות של התעשייה בארה"ב (ואירופית): עם דגמי הקוד הפתוח שלה מחושבים עם שבבים פחות יעילים מאלו של אלופי המערב, הבוט הסיני היה טוב יותר ... ואף פחות יָקָר. על פי נתוני EPOCH AI, מודל DeepSeek יהיה כל כך יעיל עד שההכשרה שלו תדרוש רק עשירית מכוח החישוב של דגם Meta Llama 3.1.

שלדברי בוט סינית כרוך גם בהגבלות על בקשות "רגישות" מסוימות. לדוגמה, אי אפשר לשאול שאלות DeepSeek הקשורות להתקוממות המקום טיין-אנמן או ב- XI Jinping.

מאז 2021, זה מאוד מסובך להשיג את הסיליקון האמריקני המתקדם ביותר בסין, בגלל המגבלות שהטיל הבית הלבן. כדי להיות מסוגלים להמשיך לעבוד, מפתחי ה- IA הסיניים חולקים את עבודתם ביניהם ומנסים גישות חדשות. ""DeepSeek התמקד באופטימיזציה של משאבים בזכות פתרונות תוכנה", מסבירקווימרינה ג'אנג, פרופסור חבר באוניברסיטת טכנולוגיה בסידני.

המומחה הטכנולוגי הסיני ממשיך: "Deepseek אימצה שיטות קוד פתוח, על ידי איגום מומחיות קולקטיבית וקידום חדשנות שיתופית. גישה זו לא רק מתגברת על אילוצי משאבים, אלא גם כדי להאיץ את פיתוח הטכנולוגיות המתקדמות, המבדילות את DeepSeek מהמתחרות הסגורות שלה יותר».

Deepseek נוצר בשנת 2023 על ידי ליאנג ונפנג בהנגז'ו. מהנדס אלקטרוניה זה הרכיב סוללה של 10,000 שבבי H100 מ- NVIDIA אשר כעת אסורים לייבא לסין. לתשתית זו הייתה מוסיפה שבבים פחות חזקים העומדים לרשות הייבוא, ואופטימיזציות להגבלת העלויות ולהפחתת כוח המחשוב הדרוש לאימוני LLM.

ההצלחה של Deepseek היא אלקטרושוק אמיתי עבור AI המערבי. הדוגמה הסינית עשויה לדחוף אותה לעבוד יותר במשותף, ולחפש יעילות רבה יותר עם התשתיות הקיימות.

🔴 לא להחמיץ שום חדשות 01net, עקוב אחרינוחדשות גוגלETWhatsAppו

מקור: קווי