Новата AI технология ще премахне комуникационните граници, като превежда с вашия глас.
Изследователите от Microsoft продължават да разкриват нови разработки, базирани на изкуствен интелект (AI), въпреки че продуктите от сътрудничеството им с Open AI вече се разпространяват сред потребители по целия свят. Този път предстоящата AI технология, на базирания в Редмънд технологичен гигант, ще позволи на потребителите да говорят на чужд език със собствения си глас.
Извадка от технологията е достъпна в туита по-долу,
Speaking foreign languages with your own voice + accent + emotion will soon be a reality.
Microsoft researchers recently extended VALL-E and trained a multi-lingual conditional codec language model to predict acoustic token sequences.
Sound ON 🔊 pic.twitter.com/1mhoChJzcC
— Lior⚡ (@AlphaSignalAI) March 8, 2023
В началото на тази година съоснователят на Microsoft, Бил Гейтс казва, че AI е следващото голямо нещо в технологичната индустрия и ще доведе до най-големите промени през следващите години.
Миналия ноември OpenAI дебютира своя разговорен чатбот и останалото е история. ChatGPT вече е част от съществуващите продукти на Microsoft. Големият езиков модел се мащабира, за да достигне до милиони потребители всеки месец.
Собствен гласов AI на Microsoft
Дори когато Microsoft се грижи за успеха на OpenAI, който е подпомогнал финансово, изследователите на компанията не остават на заден план, когато става дума за изследвания на AI.
През януари тази година компанията разкри напредъка, който е постигнала в своя изкуствен интелект за текст в реч, VALL-E. Отдалечавайки се от конвенционалните подходи като манипулиране на вълнови форми за генериране на реч, изследователите на Microsoft дават на AI възможността да генерира отделни аудио кодеци от текста и аудио подканите. Екипът също така успява да намали дължината на аудио подканата до само три секунди и все пак да получи точна реч, съответстваща на гласа на потребителя.
Това позволява на потребителите да общуват на чужди езици, използвайки собствения си глас, дори и да не ги говорят. Това може значително да помогне на хората по света да общуват по-ефективно, намалявайки пречките в комуникацията. Както се вижда в клипа по-горе, AI също е способен да изобразява правилно множество емоции, което го прави още по-реалистичен.
Microsoft е добре запознат с недостатъците и потенциалната злоупотреба с тази технология и затова все още не я е пуснал публично. Интересното е, че VALL-E е обучен на набора от данни LibriLight, който е създаден от Meta на Марк Зукърбърг, който залага много на метавселената като бъдещето на интернет.
Гигантът на търсачките, Google също работи върху своя амбициозен AI, който може да помогне на потребителите да превеждат повече от 1000 езика, говорени по целия свят.
Източник: InterestingEngineering

































