Как выбрать видеокарту под себя? Большое видеоруководство
За 10 лет, благодаря развитию искусственного интеллекта, прибыль NVIDIA выросла в 250 раз. А что конкуренты?..
Бум в сфере производства микросхем для искусственного интеллекта создаёт неуклонный спрос на тайваньские полупроводники и теперь развивается в новых направлениях.
Кто-то может возразить, что Taiwan Semiconductor Manufacturing не является производителями ИИ в том смысле, в каком являются Nvidia и Palantir, но поскольку это крупнейшее в мире предприятие по производству всех видов чипов, которые разрабатывают Nvidia, Intel и другие компании, оно вполне вписывается в эту группу.
Даже компании, которые сейчас производят собственные чипы, такие как Amazon и чип Trainium, разработанный для Amazon Web Services, который Apple скоро купит, производятся компанией Taiwan Semiconductor. На самом деле спрос на чипы для ИИ настолько велик, что у производителя больше заказов, чем он может обработать.
Сегодня центры обработки данных являются самым мощным стимулом для развития TSM. Ожидается, что следующим этапом роста для производства станут чипы для бытовой электроники с искусственным интеллектом. Спрос на смартфоны и ноутбуки с искусственным интеллектом будет настолько высоким, что аналитики прогнозируют, что они станут причиной очередной нехватки чипов. Вслед за ростом спроса на графические процессоры приходит волна устройств с поддержкой ИИ.
По прогнозам Уолл-стрит, прибыль Taiwan Semiconductor будет расти на 31% в год в течение следующих пяти лет. Аналитики установили целевую цену акций TSM на уровне 240 долларов за штуку, что означает рост на 20%.
Поскольку производители микросхем для ИИ стремятся диверсифицировать поставки, отказавшись от Nvidia в качестве основного поставщика, процессоры от Broadcom неплохо подходят для удовлетворения спроса.
Продажи её чипов для ИИ в 2024 году выросли более чем в три раза, и Broadcom ожидает, что продажи в первом квартале вырастут ещё на 65% до 3,8 млрд долларов. Эта оценка может оказаться заниженной.
На прошлой неделе отраслевой сайт The Information сообщил, что Apple совместно с Broadcom приступил к разработке своего первого серверного чипа, специально предназначенного для обработки данных с помощью ИИ.
Гиперосцилляторы, в частности, стимулируют продажи специальных ускорителей искусственного интеллекта от Broadcom, и сетевых микросхем для торговых сетей. Выручка от сетевых решений на основе искусственного интеллекта, которая составила 76% от всей выручки компании в этой области, выросла на 158% по сравнению с прошлым годом.
На долю чипов с искусственным интеллектом пришлось 15% от общей выручки Broadcom, и хотя компания ожидала, что в конце финансового года они составят 35% от общей выручки, на самом деле они достигли 41% продаж.
Похоже, что Broadcom готова взять на себя роль ведущего производителя микросхем для ИИ.
Хотелось бы и в России не сильно отставать от лидеров в производстве микропроцессоров, но пока это из области фантастики.
Искусственный интеллект поедает слишком много энергии. Как решают проблему?
Для сравнения направлений развития отечественной экономики, всегда полезно знать о мировых тенденциях и способах решения проблем.
Средняя стоимость электроэнергии в Америке составляет сегодня восемь центов за киловатт-час. В Европе этот показатель составляет 18. К примеру, в Великобритании, он составляет около 23 центов. Таким образом, стоимость эксплуатации одного из таких центров обработки данных гига масштаба в США составит от 300 до 400 миллионов долларов в год, а в такой стране, как Великобритания, — более миллиарда долларов в год.
Другие страны могут производить электроэнергию в больших объёмах и по более низкой цене по сравнению с США, например, Россия, Китай… Но, ни Россия, ни Китай — это не вариант для американских технологических компаний с политической точки зрения. Они не будут хранить все свои данные в Китае… Еще Ближний Восток, где IT гиганты начинают строить некоторые центры обработки данных. Но, вопрос в политической ситуации в регионе, там остаётся главным.
90% прироста мощности центров обработки данных в ближайшие годы будет обеспечиваться искусственным интеллектом. Одна из проблем заключается в том, что большинство этих центров обработки данных будут построены в Соединённых Штатах Америки. Проблема, как видно из приведённой ниже диаграммы, заключается в том, что с начала века производство электроэнергии в Соединённых Штатах практически не растёт.
Период растущего спроса на электроэнергию создаст нагрузку на энергосистему. По данным экспертов, ожидается, что выработка электроэнергии только для центров обработки данных вырастет с 4,5% в 2023 году до 14,6% в 2028 году.
Уважаемые читатели!
Приглашаем Вас поддержать наш проект и подписаться. Каждому, кто внёс сумму от 350 руб. или выше, отправим на вашу почту новую книгу Ю.Смирнова о геополитике вокруг России, и русской идее. В интернет-магазинах эта книга стоит дороже.
Атомная энергетика привлекательна тем, что обеспечивает чистую, мощную и непрерывную подачу энергии. Одна атомная электростанция может обеспечить энергией крупнейшие центры обработки данных, которые планируется построить в ближайшее время. Однако, учитывая, что для строительства новых центров обработки данных в ближайшие годы, вероятно, потребуется около 60 гигаватт новой электроэнергии, один небольшой модульный ядерный реактор обеспечивает менее 1/100 дополнительной электроэнергии, необходимой для развития ИИ.
В 2023 году расходы на оборудование для центров обработки данных составили около 49 миллиардов долларов. Ожидается, что благодаря новым центрам обработки данных, создаваемым для обучения и запуска моделей ИИ, в 2026 году эта цифра вырастет до 167 миллиардов долларов. До половины этих расходов придётся на компании, создающие системы электропитания (генераторы, трансформаторы, источники бесперебойного питания, системы распределения электроэнергии и т. д.). Ещё 1/3 этих расходов может пойти на системы охлаждения.
К примеру, новые чипы NVIDIA Blackwell потребляют 1000 Вт и требуют передовых методов охлаждения, при которых охлаждающая жидкость напрямую контактирует с пластиной чипа на самом процессоре. Одна из особенностей заключается в том, что он невероятно энергозатратен, чипы NVIDIA будут потреблять ещё больше энергии, что приведёт к увеличению энергопотребления. Если разместить эти чипы на плате близко друг к другу, они, по сути, будут нагревать друг друга. Поэтому мировые технологические компании вложили значительные средства в системы охлаждения, в продвинутые технологии, вроде системы охлаждения, установленной на сам чип, пластину над ним, чтобы рассеивать тепло.
Мировые IT компании подписали обязательства по углеродной нейтральности. Запустить много угольных электростанций, уже невозможно. Они не смогут тогда выполнить данные ими обещания. Поэтому компаниям нужна возможность получать стабильную, экологически чистую энергию высокой плотности, и атомная энергетика — один из самых простых способов.
Сейчас во всем мире центры обработки данных потребляют всего 4,5% от общего объема энергопотребления. Почти все новые электростанция будут строится в одном месте. Это Соединённые Штаты Америки. И именно там будет построено 70 процентов новых электростанций для этого бума искусственного интеллекта.
И хотя ситуация с регулированием в Америке не идеальна — она намного лучше, чем в той же Европе, где начать производство электроэнергии практически невозможно. Предполагается, что в США производство электроэнергии в центрах обработки данных вырастет с 4-5 процентов от общего объема до 14,6% в течение пяти лет. Это создает невероятную нагрузку на энергосистему, потому что с 2000 года производство электроэнергии в США практически не менялось.
Чтобы подключить новую экологически чистую энергию к сети, потребуется около пяти лет. Цепочки поставок тоже являются проблемой. Илон Маск утверждал недавно, что мы даже не можем построить достаточное количество трансформаторов. В системе электроснабжения так много деталей и компонентов, что это займёт много времени.
Проблема ещё и в том, что растущий спрос на центры обработки данных потребует около 60 гигаватт новой мощности в течение ближайшего периода. Поэтому одна из сделок в атомной энергетике, например, та, которую заключила Amazon, — это одна сотая от необходимого для США. Google также строит— проект Kairos. Это амбициозная цель, которую планируют завершить к 2030 году.
AI for the Chronically Lazy: Mastering the Art of Doing Nothing with Gemini
The updates to Gemini and Gemma models significantly enhance their technical capabilities and broaden their impact across various industries, driving innovation and efficiency while promoting responsible AI development.
Key Points
Gemini 1.5 Pro and 1.5 Flash Models:
📌Gemini 1.5 Pro: Enhanced for general performance across tasks like translation, coding, reasoning, and more. It now supports a 2 million token context window, multimodal inputs (text, images, audio, video), and improved control over responses for specific use cases.
📌Gemini 1.5 Flash: A smaller, faster model optimized for high-frequency tasks, available with a 1 million token context window.
Gemma Models:
📌Gemma 2: Built for industry-leading performance with a 27B parameter instance, optimized for GPUs or a single TPU host. It includes new architecture for breakthrough performance and efficiency.
📌PaliGemma: A vision-language model optimized for image captioning and visual Q& A tasks.
New API Features:
📌Video Frame Extraction: Allows developers to extract frames from videos for analysis.
📌Parallel Function Calling: Enables returning more than one function call at a time.
📌Context Caching: Reduces the need to resend large files, making long contexts more affordable.
Developer Tools and Integration:
📌Google AI Studio and Vertex AI: Enhanced with new features like context caching and higher rate limits for pay-as-you-go services.
📌Integration with Popular Frameworks: Support for JAX, PyTorch, TensorFlow, and tools like Hugging Face, NVIDIA NeMo, and TensorRT-LLM.
Impact on Industries
Software Development:
📌Enhanced Productivity: Integration of Gemini models in tools like Android Studio, Firebase, and VSCode helps developers build high-quality apps with AI assistance, improving productivity and efficiency.
📌AI-Powered Features: New features like parallel function calling and video frame extraction streamline workflows and optimize AI-powered applications.
Enterprise and Business Applications:
📌AI Integration in Workspace: Gemini models are embedded in Google Workspace apps (Gmail, Docs, Drive, Slides, Sheets), enhancing functionalities like email summarization, Q& A, and smart replies.
📌Custom AI Solutions: Businesses can leverage Gemma models for tailored AI solutions, driving efficiency and innovation across various sectors.
Research and Development:
📌Open-Source Innovation: Gemma’s open-source nature democratizes access to advanced AI technologies, fostering collaboration and rapid advancements in AI research.
📌Responsible AI Development: Tools like the Responsible Generative AI Toolkit ensure safe and reliable AI applications, promoting ethical AI development.
Multimodal Applications:
📌Vision-Language Tasks: PaliGemma’s capabilities in image captioning and visual Q& A open new possibilities for applications in fields like healthcare, education, and media.
📌Multimodal Reasoning: Gemini models' ability to handle text, images, audio, and video inputs enhances their applicability in diverse scenarios, from content creation to data analysis.
Искусственный интеллект для хронически ленивых с Gemini
Обновления моделей Gemini и Gemma значительно расширяют их технические возможности и влияние на различные отрасли, стимулируя инновации и эффективность, а также способствуя ответственному развитию искусственного интеллекта.
Ключевые аспекты
Модели Gemini 1.5 Pro и 1.5 Flash:
📌 Gemini 1.5 Pro: Улучшена общая производительность в таких задачах, как перевод, кодирование, логические рассуждения. Теперь поддерживается контекстное окно с 2 миллионами токенов, мультимодальные входные данные (текст, изображения, аудио, видео) и улучшенный контроль ответов для конкретных случаев использования.
📌 Gemini 1.5 Flash: Компактная и быстрая модель, оптимизированная для высокочастотных задач, доступна в контекстном окне с 1 миллионом токенов.
Модели Gemma:
📌 Gemma 2: Создан для обеспечения лучшей в отрасли производительности благодаря экземпляру с параметрами 27B, оптимизирован для графических процессоров или одного узла TPU. Он включает в себя новую архитектуру, обеспечивающую высокую производительность и эффективность.
📌 PaliGemma: модель языка визуализации, оптимизированная для создания субтитров к изображениям и задач визуального контроля.
Новые возможности API:
📌 Извлечение видеокадров: позволяет разработчикам извлекать кадры из видео для анализа.
📌 Параллельный вызов функций: позволяет выполнять более одного вызова функции одновременно.
📌 Кэширование контекста: Сокращает необходимость повторной отправки больших файлов, делая длинные контексты более доступными.
Инструменты и интеграция для разработчиков:
📌 Google AI Studio и Vertex AI: дополнены новыми функциями, такими как кэширование контекста и более высокие тарифы для платных сервисов.
📌 Интеграция с популярными платформами: поддержка JAX, PyTorch, TensorFlow и таких инструментов, как Hugging Face, NVIDIA NeMo и TensorRT-LLM.
Влияние на отрасли промышленности
Разработка программного обеспечения:
📌 Повышенная производительность: Интеграция моделей Gemini в такие инструменты, как Android Studio, Firebase и VSCode, помогает разработчикам создавать высококачественные приложения с помощью искусственного интеллекта, повышая производительность и результативность.
📌 Возможности на базе искусственного интеллекта: Новые функции, такие как параллельный вызов функций и извлечение видеокадров, упрощают рабочие процессы и оптимизируют приложения на базе искусственного интеллекта.
Корпоративные и бизнес-приложения:
📌 Интеграция искусственного интеллекта в Workspace: модели Gemini встроены в приложения Google Workspace (Gmail, Docs, Drive, Slides, Sheets), что расширяет функциональные возможности, такие как составление резюме по электронной почте, вопросы и ответы, а также интеллектуальные ответы.
📌 Индивидуальные решения в области искусственного интеллекта: Компании могут использовать модели Gemma для создания индивидуальных решений в области искусственного интеллекта, повышающих эффективность и инновации в различных секторах.
Исследования и разработки:
📌 Инновации с открытым исходным кодом: открытый исходный код Gemma демократизирует доступ к передовым технологиям искусственного интеллекта, способствуя сотрудничеству и быстрому прогрессу в исследованиях ИИ.
📌 Ответственная разработка ИИ: Такие инструменты, как Responsible Generative AI Toolkit, обеспечивают безопасность и надежность приложений ИИ, способствуя этичной разработке ИИ.
Мультимодальные приложения:
📌 Задачи на визуальном языке: возможности PaliGemma в области субтитров к изображениям и визуальных вопросов и ответов открывают новые возможности для приложений в таких областях, как здравоохранение, образование и медиа.
📌 Мультимодальное мышление: способность моделей Gemini обрабатывать текст, изображения, аудио- и видеосигналы повышает их применимость в различных сценариях — от создания контента до анализа данных.
Обзор рынка США с Александром Миллером
Обзор рынка США с Александром Миллером