3DNews (25.01.2025)
Привет! Это 3DNews и ежедневная рассылка, в которой мы кратко рассказываем, что произошло в мире технологий. Главное за сегодня: | | |
Лидерство США в ИИ под большим вопросом - DeepSeek, малоизвестный разработчик ИИ из Китая, вызвал переполох в Кремниевой долине выпуском ИИ-моделей, которые превосходят решения OpenAI, Anthropic и других.
При этом у DeepSeek нет доступа к гигантским бюджетам и передовым чипам.
- Модель DeepSeek-V3 появилась в декабре 2024 года и включает 671 млрд параметров. Она была обучена за 55 дней на чипах Nvidia H800 (урезанная версия H100 для Китая), а на её разработку ушло всего $6 млн (на порядок меньше, чем было потрачено на обучение Llama 3.1).
- DeepSeek-V3 превзошла Llama 3.1, GPT-4o и Claude 3.5 Sonnet в ряде бенчмарков.
- В понедельник вышла рассуждающая модель DeepSeek R1 на базе DeepSeek-V3, которая превосходит OpenAI o1 и демонстрирует выдающиеся результаты в логических задачах, математике и программировании.
- Высокая эффективность и стремительное развитие DeepSeek вызвала панику не только в Google, OpenAI, Anthropic, но и у экстремистов из Meta. К счастью для американцев, модели DeepSeek имеют открытый исходный код, что облегчает их изучение.
- DeepSeek уже стала катализатором ценовой войны на рынке ИИ в Китае. Но компания способна претендовать на глобальное лидерство. Попробовать модели DeepSeek можно на сайте (русский поддерживается).
- DeepSeek — не единственная китайская компания, делающая успехи. Вчера ByteDance, которая владеет TikTok, запустила новую модель Doubao-1.5-pro. По качеству ответов она сравнима с o1 от OpenAI, но стоит для пользователей существенно дешевле.
| | |
Понравилась статья? Подпишитесь на канал, чтобы быть в курсе самых интересных материалов
Подписаться
Свежие комментарии