Молодий китайський стартап DeepSeek сколихнув технологічний світ, випустивши модель ШІ з відкритим кодом. Додаток компанії DeepSeek R1 очолив рейтинги завантажень в App Store у шести країнах, випередивши ChatGPT від Open AI.
Що таке DeepSeek R1 і в чому його особливість
Стартап DeepSeek з'явився на світ у 2023 році. Його засновник - Лянь Веньфен, керівник ШІ-орієнтованого хедж-фонду High-Flyer. Компанія розробляє моделі ШІ з відкритим вихідним кодом, щоб спільнота розробників могла перевіряти та надалі вдосконалювати ПЗ.
Головна "родзинка" DeepSeek R1 полягає у формулюванні міркувань перед наданням відповіді, що відрізняє її від інших чат-ботів, як-от ChatGPT від OpenAI.
В компанії заявили, що її реліз R1 забезпечує продуктивність на рівні останньої версії OpenAI. В DeepSeek додали також, що надають ліцензію зацікавленим особам для подальшого розвитку технології.
DeepSeek R1: чим відрізняється від ChatGPT та Meta AI
DeepSeek R1 вирізняється низькими витратами на розробку порівняно з OpenAI та Meta AI. Розробник наголошує на високій ефективності моделі при менших інвестиціях.
Висока ефективність моделі ставить під сумнів потребу в масштабних інвестиціях у найновіші ШІ-прискорювачі від Nvidia. Це, серед іншого, загострює увагу до обмежень США на експорт передових напівпровідників до Китаю, які мали б запобігти технологічному прориву, що його, очевидно, демонструє зараз світу DeepSeek.
Стартап тренував свою модель чипах Nvidia H800, які вважаються "середньокласовими". І попри обмежене технічне оснащення, DeepSeek спромігся створити таку ж або кращу нейромережу, ніж ChatGPT, та забезпечив її вищу енергоефективність, що робить її більш екологічно дружньою.
Модель R1, як запевняють в компанії, як запевняють в компанії, не поступається або навіть і перевершує конкуруючі моделі за ключовими бенчмарками:
- AIME 2024 (математичні задачі),
- MMLU (загальні знання),
- AlpacaEval 2.0 (продуктивність питань-відповідей).
Найбільш вражаючим у DeepSeek є надзвичайно низька вартість розробки моделі. Згідно з технічним звітом компанії, загальні витрати склали лише 5,576 мільйона доларів. Для порівняння, OpenAI витратила лише на навчання GPT-4 близько 100 мільйонів доларів.
Вплив DeepSeek на глобальний ринок
Ажіотаж навколо DeepSeek обвалив акції техногігантів
Китайський стартап спровокував масштабний обвал на технологічних ринках, коли показав ефективну роботу ШІ на менш потужних чіпах. Поява DeepSeek поставила під сумнів уявлення про відставання китайських ШІ-технологій від американських.
Акції Nvidia впали більш ніж на 10% на премаркеті 27 січня, ф'ючерси Nasdaq 100 знизились на 5,2% – найбільше падіння з серпня.
В Європі найбільше постраждав виробник чипового обладнання ASML Holding, акції якого впали на 12%. Загальні втрати ринкової капіталізації Nasdaq 100 та європейського технологічного субіндексу Stoxx 600 можуть сягнути 1,2 трлн дол.
Китайські акції, пов'язані з ШІ, навпаки, зросли. Зокрема, акції Merit Interactive досягли добового ліміту зростання, а індекс Hang Seng Tech піднявся на 2%.
Паніка навколо DeepSeek: ціна на біткоїн пішла вниз
Біткоїн впав на 6,5% через появу китайської моделі ШІ R1, яка спровокувала глобальний розпродаж ризикованих активів. Альткоїни втратили ще більше - RP та Solana втратили по 9%.
"Китайська модель становить потенційну загрозу для фондових ринків США, порушуючи домінування американського ШІ своєю економічною ефективністю", - йдеться у звіті QCP Asia.
Як писав "Ми-Україна" раніше, 23 січня у ChatGPT стався масштабний технічний збій, внаслідок якого чат-бот став недоступним у всьому світі.