DeepSeek в действии

DeepSeek – это генеративная модель искусственного интеллекта с открытым исходным кодом, основанная на архитектуре Transformer и объединяющая передовые технологии, такие как архитектура MoE, обучение с переменной разрядностью и распределенная оптимизация. Она хорошо зарекомендовала себя в области генерации текста, мультимодальной обработки и адаптации под конкретные прикладные задачи. В книге описаны особенности глубоко оптимизированной архитектуры DeepSeek-V3 и способы применения модели на практике.
Рассматриваемые темы:
Теоретические основы – базовая архитектура и технологии обучения моделей типа Transformer, механизм внимания DeepSeek, законы масштабирования и их применение в оптимизации моделей.
Основные приемы работы – начало работы с моделью, знакомство с API, реализация диалога, функции обратного вывода, кеширование на диске и оптимизация кеша.
Расширенное применение – реализация чат-клиентов, интеллектуальных помощников, плагинов VS Code и т. д.
Книга будет полезна исследователям технологий генеративного ИИ, инженерам-разработчикам программного обеспечения, специалистам по обработке данных, а также всем желающим быстро освоить практическое применение больших языковых моделей.
Название: DeepSeek в действии
Год издания: 2025
Автор: Яценков В.
Жанр: Искусственный интеллект
Количество страниц: 407
Формат: PDF
Язык: Русский
Размер: 17 Mb
Скачать DeepSeek в действии
Внимание! У Вас нет прав для просмотра скрытого текста.
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.