


23 април — Tencent пусна и отвори своя голям езиков модел Hunyuan Hy3 визуализация. Моделът използва архитектура от смесени експерти (MoE) с общо 295 милиарда параметри, 21 милиарда активни параметри и поддържа до 256K дължина на контекста.

Tencent каза, че моделът подобрява следването на инструкциите, разбирането на дълъг контекст, сложните разсъждения и способностите на агентите. Вместо да преследва мащаб от трилиони параметри, компанията избра конфигурация от приблизително 300B, за да балансира производителността с разходите за внедряване и използваемостта в реалния свят.
Tencent Cloud предлага цени на API, започващи от 1,2 RMB за милион входни токени и 4 RMB за милион изходни токени, заедно с абонаментен план. Чрез оптимизиране на извода ефективността се е подобрила с около 40%.
Визуализацията на Hy3 е интегрирана в множество продукти на Tencent, включително Yuanbao, Tencent Docs и Tencent News, със специфични за сценария адаптации. Компанията го описа като първото издание след преструктуриране на нейната моделна система Hunyuan, с планирана по-нататъшна работа в предварителното обучение, обучението за укрепване и инженерното внедряване.
Източник: Tencent Tech
Source link
Like this:
Like Loading…
Нашия източник е Българо-Китайска Търговско-промишлена палaта