Предварителен преглед на Tencent с отворен код Hunyuan Hy3, фокусиран върху практическото внедряване

23 април — Tencent пусна и отвори своя голям езиков модел Hunyuan Hy3 визуализация. Моделът използва архитектура от смесени експерти (MoE) с общо 295 милиарда параметри, 21 милиарда активни параметри и поддържа до 256K дължина на контекста.

1111.jpg

Tencent каза, че моделът подобрява следването на инструкциите, разбирането на дълъг контекст, сложните разсъждения и способностите на агентите. Вместо да преследва мащаб от трилиони параметри, компанията избра конфигурация от приблизително 300B, за да балансира производителността с разходите за внедряване и използваемостта в реалния свят.

Tencent Cloud предлага цени на API, започващи от 1,2 RMB за милион входни токени и 4 RMB за милион изходни токени, заедно с абонаментен план. Чрез оптимизиране на извода ефективността се е подобрила с около 40%.

Визуализацията на Hy3 е интегрирана в множество продукти на Tencent, включително Yuanbao, Tencent Docs и Tencent News, със специфични за сценария адаптации. Компанията го описа като първото издание след преструктуриране на нейната моделна система Hunyuan, с планирана по-нататъшна работа в предварителното обучение, обучението за укрепване и инженерното внедряване.

Източник: Tencent Tech

Source link

Like this:

Like Loading…

Нашия източник е Българо-Китайска Търговско-промишлена палaта

By admin