Дослідники Sesame AI оголосили про інноваційну модель CSM або розмовної мови, що перевершила з точки зору людської мімікриї, як, наприклад, з Google (Duplex) та OpenAI (OMNI). Демонстрація мала два різні голоси AI, що отримали назву «милі» для чоловіків та «Майя» для жінок, які були проголосовані деякими кінцевими користувачами за ретельну якість.

Однак доступ до технології з боку людей може бути не таким простим, як спроби залучити це, що призвело до повідомлення про те, що Sesame працює над тим, щоб збільшити свою здатність привернути більше людей та перетворити себе як клієнтів із простих глядачів. Наразі можна отримати доступ до чудової 30-хвилинної демонстрації через магію Creator Magic YouTube.

Найновіша складна технологія Сезама є мультимодальною, а це означає, що вона поєднує текст та аудіо в єдиній структурі, інший, більш природний досвід синтезу мовлення. Подібно до того, що OpenAi зробив для своїх голосових моделей, можна побачити схожість між двома об’єктами.

Майже якість людини досягається системою, але все ще має проблеми з утримуючим контекстом, кроком та потоком, який кунжутне випромінювання. Співзасновник Брендан Ірібе висловлює його відверто: «Це дуже багато в долині», хоча він також сподівається, що майбутній прогрес зменшить цей розрив.

Однак це революційне насіння, і багато суперечок щодо його суспільних ефектів вибухнуло. Реакції були все, від захоплення та ентузіазму до побоювання і навіть страху.

Ці «хибні» фактори в мовленні, як звучить дихання, посмішки або кілька коригувальних дій натуралізують розмови через CSM. Вищезазначені риси вражають реалістичний штрих і можуть допомогти технології перетинатись через долину Невиставку в наступних версіях.

Виразність програмного забезпечення заробила захоплення від користувачів, які часто відчувають себе так, ніби розмовляючи з реальною людиною, коли вони його слухають. Деякі навіть стверджували, що утворили емоційні прихильності

От admin