مدلهای هوش مصنوعی استارتاپ چینی دیپسیک نهتنها از نظر عملکرد قابل مقایسه با بهترین چتباتهای هوش مصنوعی جهان هستند، بلکه بهنظر میرسد هزینه ایجاد آنها نیز بخش کوچکی از سرمایههایی است که در سایر نقاط دنیا برای تولید بهترین مدلهای هوش مصنوعی صرف میشود...
«دیپسیک» (DeepSeek)، یک استارتاپ هوش مصنوعی چینی که کمی بیش از یک سال از تأسیس آن میگذرد، حیرت سیلیکونولی را برانگیخته است، آن هم پس از آنکه به انتشار مدلهای موفق هوش مصنوعی اقدام کرد.
به نوشته بلومبرگ، مدلهای هوش مصنوعی این شرکت چینی نهتنها از نظر عملکرد قابل مقایسه با بهترین چتباتهای هوش مصنوعی جهان هستند، بلکه بهنظر میرسد هزینه ایجاد آنها نیز بخش کوچکی از سرمایههایی است که در سایر نقاط دنیا برای تولید بهترین مدلهای هوش مصنوعی صرف میشود.
در اواخر ژانویه و بهدنبال هیاهوی پیرامون نوآوریهای دیپسیک، سهامهای فناوری در سطح جهان با افت همراه شدند و سرمایهگذاران این بحث را مطرح کردند که معرفی این مدل هوش مصنوعی چینی چه تبعاتی برای رقبای آمریکایی آن خواهد داشت.
دیپسیک دقیقا چیست؟
دیپسیک در سال 2023 توسط لیانگ ونفنگ تأسیس شد که رئیس صندوق سرمایهگذاری High-Flyer مبتنی بر هوش مصنوعی است. این شرکت مدلهای هوش مصنوعی را توسعه میدهد که منبع باز هستند، به این معنا که جامعه توسعهدهندگان میتوانند نرمافزار آن را بررسی کنند و آن را بهبود بخشند. اپلیکیشن این مدل هوش مصنوعی برای تلفنهای همراه پس از انتشار در اوایل ژانویه به صدر دانلودهای آیفون در آمریکا رسید.
مدل هوش مصنوعی دیپسیک با قابلیت استدلال قبل از ارائه پاسخ به یک درخواست، خود را از سایر چتباتهای هوش مصنوعی متمایز میکند. این شرکت ادعا میکند که نسخه R1 آن عملکردی برابر با آخرین نسخه شرکت اوپن اِیآی، سازنده چت جیپیتی، ارائه میدهد.
مدل R1 دیپسیک چگونه با چت جیپیتی و هوش مصنوعی متا قابل مقایسه است؟
اگرچه جزئیات کاملی از سوی شرکت دیپسیک ارائه نشده است، اما بهنظر میرسد هزینه آموزش و توسعه مدلهای این استارتاپ چینی تنها کسری از سرمایه صرفشده برای ایجاد بهترین محصولات اوپن اِیآی و متا پلتفرمز بوده است. بهینهتر بودن مدل هوش مصنوعی دیپسیک این سوال را مطرح کرده است که آیا نیازی به سرمایههای هنگفت برای خریداری تازهترین و قدرتمندترین تراشههای هوش مصنوعی ساختهشده توسط شرکتهایی مانند انویدیا وجود دارد یا خیر.
مدل هوش مصنوعی قدرتمند چین همچنین توجهات به محدودیتهایی که آمریکا برای صادرات تراشههای پیشرفته به چین وضع کرده است را جلب میکند، آن هم با توجه به این موضوع که هدف واشنگتن از این محدودیتها جلوگیری از پیشرفت قابل توجه پکن در حوزه هوش مصنوعی بوده است؛ نقطه متضادی که به نظر میرسد دیپسیک به آن دست پیدا کرده است.
دیپسیک میگوید که R1 در چندین معیار مانند مدلهای AIME 2024 برای وظایف ریاضی، MMLU برای دانش عمومی و AlpacaEval 2.0 برای عملکرد پرسش و پاسخ، نزدیک یا بهتر از مدلهای رقیب است. این مدل همچنین در بین برترین عملکردها در یک جدول امتیازی وابسته به دانشگاه کالیفرنیا برکلی بهنام Chatbot Arena قرار دارد.
پیامدهای آن برای بازار جهانی هوش مصنوعی چیست؟
موفقیت دیپسیک ممکن است شرکت اوپن اِیآی و سایر ارائهدهندگان آمریکایی را مجبور کند برای حفظ موقعیت خود، قیمتها را کاهش دهند. اگر مدلهای کارآمدتر مانند دیپسیک بتوانند با هزینه بسیار کمتری رقابت کنند، هزینههای هنگفت شرکتهایی مانند متا و مایکروسافت - که هر کدام در سال جاری 65 میلیارد دلار یا بیشتر را برای هزینههای سرمایهای، عمدتا در زیرساختهای هوش مصنوعی، متعهد شدهاند - مورد سؤال قرار خواهد گرفت.
در حال حاضر، توسعهدهندگان در سراسر جهان در حال آزمایش نرمافزار دیپسیک و تلاش برای ساخت ابزارهایی با استفاده از آن هستند. این امر میتواند پذیرش مدلهای استدلال پیشرفته هوش مصنوعی را تسریع کند، در حالیکه همچنین ممکن است نگرانیهای بیشتری در مورد نیاز به ایجاد محدودیتها برای استفاده از آنها ایجاد کند.
کاستیهای دیپسیک چیست؟
به گزارش اکوایران،مانند همه مدلهای هوش مصنوعی چینی دیگر، دیپسیک در مورد موضوعات حساس در چین خودسانسوری میکند. این مدل سؤالاتی در مورد اعتراضات میدان تیان آنمن در سال 1989 یا سؤالات جغرافیایی سیاسی مانند احتمال حمله چین به تایوان را منحرف میکند. در آزمایشها، بات دیپسیک قادر است پاسخهای مفصلی در مورد چهرههای سیاسی مانند نارندرا مودی، نخستوزیر هند، ارائه دهد اما از انجام این کار در مورد شی جینپینگ، رئیسجمهور چین، امتناع میکند.