
Нов гласов модел с изкуствен интелект от Alibaba Group Holding победи западните съперници OpenAI и xAI на основен глобален бенчмарк, подчертавайки техническото си предимство в улавянето на сложни китайски диалекти и акценти.
Fun-Realtime-TTS-Preview, разработен от лабораторията Tongyi на Alibaba, си осигури петото място в класацията на Artificial Analysis Speech Arena с резултат от 1190. Това беше единствената гласова система, проектирана от Китай, в глобалната топ пет.
Alibaba притежава South China Morning Post.
Бенчмаркът Speech Arena се управлява от Artificial Analysis, базирана в Сан Франциско организация за оценка на AI, подкрепена от инвеститори, включително бившия главен изпълнителен директор на GitHub Нат Фридман и основателя на Google Brain Андрю Нг.
Платформата класира моделите чрез слепи потребителски оценки на генерирани речеви клипове, използвайки базирана на Elo система. Потребителите на Speech Arena тестват колко добре могат да се представят моделите в три основни възможности – преобразуване на реч в текст, разрешаване на разбиране на глас от край до край и разговорно взаимодействие и трансформиране на текст в естествено звучаща реч.
В отделен индекс за честота на грешка в думата за изкуствен анализ, моделът Fun-Realtime-ASR на Alibaba се класира на първо място с процент на грешка в думата от 1,8 процента, което означава, че по-малко от две думи на всеки 100 са били транскрибирани неправилно.
Логото на Alibaba е изобразено пред офисите й в Пекин на 1 април 2026 г. Снимка: AFP
Source link
Like this:
Like Loading…
Нашия източник е Българо-Китайска Търговско-промишлена палaта