Одиночный чип обеспечивает 1PetaOps / сек
Groq называет свою архитектуру Tensor Streaming Processor (TSP). Два года назад он заявил, что набрал восемь из десяти человек, которые разработали Google Tensor Processing Unit (TPU).
Компания привлекла $ 62,3 млн.
Архитектура Groq эквивалентна одному квадриллиону операций в секунду или 1e15 операциям в секунду и способна выполнять до 250 триллионов операций с плавающей запятой в секунду (FLOPS).
«Ведущие компании, занимающиеся производством графических процессоров, рассказывают клиентам, что они надеются достичь производительности PetaOp / s в течение следующих нескольких лет; Groq объявляет об этом сегодня, - говорит генеральный директор Groq Джонатан Росс, - архитектура Groq во много раз быстрее, чем все остальное, доступное для вывода, с точки зрения как низкой задержки, так и выводов в секунду. У нас были первые программы по возврату кремния, включенные в первый день, программы, запущенные в течение первой недели, отобранные у партнеров и клиентов менее чем за шесть недель, а кремний A0 поступил в производство ».
Архитектурно-ориентированный подход Groq, основанный на программном подходе, претендует на достижение как гибкости вычислений, так и большого параллелизма без накладных расходов на синхронизацию с традиционными архитектурами GPU и CPU.
Архитектура Groq может поддерживать как традиционные, так и новые модели машинного обучения, и в настоящее время работает на сайтах заказчиков как в системах x86, так и в системах, отличных от x86.
Архитектура разработана специально для требований к производительности компьютерного зрения, машинного обучения и других рабочих нагрузок, связанных с ИИ.
Планирование выполнения происходит в программном обеспечении, освобождая кремниевую недвижимость, иначе предназначенную для динамического выполнения команд.
Жесткий контроль, обеспечиваемый этой архитектурой, обеспечивает детерминированную обработку, что особенно ценно для приложений, где безопасность и точность имеют первостепенное значение.
По сравнению со сложными традиционными архитектурами, основанными на процессорах, графических процессорах и FPGA, чип Groq также упрощает квалификацию и развертывание, позволяя клиентам просто и быстро внедрять масштабируемые системы с высокой производительностью на ватт.
