Глосарій voice AI

Терміни голосового ШІ, телефонії та панелі Адама - що вони означають і що Адам з ними робить.

Голос і мовлення

Аудіомашинерія, на якій працює кожен дзвінок зі ШІ.

ASR (автоматичне розпізнавання мовлення)
Система, що на льоту перетворює мову співрозмовника на текст. Інакше speech-to-text. Її точність - стеля для всього далі, і міряють її коефіцієнтом WER на справжньому записі розмови. Працює в реальному часі, видаючи слова ще до того, як співрозмовник договорить речення - і це перше, що ми налаштовуємо для кожної мови, польську найретельніше.
STT (speech-to-text)
Те саме, що ASR, під назвою, якою частіше користуються хмарні платформи. В Адама входить у ціну за хвилину - без окремого постачальника мовлення, якого треба підключати й оплачувати.
TTS (синтез мовлення)
Система, що перетворює слова Адама на голос у слухавці. Оцінюється за природністю, просодією і тим, як швидко з’являється перший звук. Кожна мова отримує природний голос, налаштований під неї, а не загальний, приклеєний збоку.
Клонування голосу
Створення синтетичного голосу з короткого запису реальної людини. Адам не клонує ваших працівників - кожна мова отримує власний природний голос, щоб польська звучала по-польськи, а не як переклад.
Затримка
Проміжок між кінцем фрази співрозмовника і початком відповіді Адама. Нижче приблизно 400 мілісекунд звучить як звичайна розмова; понад секунду - люди відчувають затримку й вимикаються. Тримати її низькою - більшість інженерії голосового агента.
Barge-in
Коли співрозмовник перебиває Адама на півслові. Продакшн-агент має вловити це десь за 150 мілісекунд, чисто замовкнути й сприйняти перебивання як справжню відповідь. Люди постійно перебивають телефонні розмови, тож це базова вимога.
VAD (детекція голосової активності)
Компонент, який вирішує, що співрозмовник договорив. Налаштування - це компроміс між чуйністю - вступити зарано - і терплячістю - перечекати паузу посеред речення. Погане налаштування - найчастіша причина, чому агенти перебивають людей.
Визначення черги
Ширше судження, чия черга говорити - VAD плюс контекст того, що вже сказано. Добре чергування - різниця між розмовою і двома монологами, що розминаються в повітрі.
Діаризація
Розрізнення, хто що сказав, коли на лінії більше ніж одна людина. Тримає транскрипт у порядку й підказує Адаму, якому голосу відповідати.
WER (word error rate)
Стандартна міра точності розпізнавання мовлення: слова, почуті неправильно, загублені чи вигадані, на тлі всього сказаного. Що нижче, то краще. Шумні лінії та власні назви піднімають показник; чистий запис тримає його в межах однієї цифри.

Телефонія

Як дзвінок доходить до телефона.

PSTN
Публічна комутована телефонна мережа - глобальна система, на якій тримається кожен мобільний і стаціонарний. Дзвінки Адама - звичайні дзвінки в ній: дзвонить справжній телефон, без жодного застосунку.
SIP
Session initiation protocol - спосіб встановлювати, вести й завершувати дзвінки через інтернет. Сантехніка сучасної телефонії.
SIP trunking
Передавання дзвінків до й від телефонної системи через SIP замість фізичних ліній - те, як бізнес підключає свою телефонію до зовнішньої мережі.
E.164
Міжнародний формат номера: плюс, код країни, номер, без пробілів - +48512345678. Формат, якого очікують імпорт лідів і API Адама.
Caller ID
Номер, який видно на телефоні, що дзвонить. Адам дзвонить зі справжніх, виділених номерів - не з анонімних чи підмінених.
DTMF
Тони клавіатури телефона - сигнали «натисніть 1», на яких працюють старі телефонні меню.
IVR
Interactive voice response - дерево меню, яке більшість уявляє, почувши «автоматичний дзвінок». Розмовні агенти на кшталт Адама замінюють меню звичайною розмовою.
Розпізнавання автовідповідача
Відрізнити живе «алло?» від голосової пошти в перші секунди дзвінка. Від цього залежить, чи Адам веде розмову, чи ввічливо планує повторну спробу.
Тепла передача
Передати співрозмовника людині разом із контекстом, а не холодним трансфером. В Адама це гаряча черга: лід, транскрипт і причина, чому він гарячий, чекають на дзвінок людини.
Паралельні дзвінки
Скільки дзвінків триває одночасно. Визначає, як швидко кампанія опрацьовує список - ліди ведуться паралельно, а не один за одним.

Платформа Adam

Слова з панелі Адама.

Сценарій розмови (pathway)
Спроєктована розмова: з чого Адам починає, що питає, як реагує, коли завершує. Новий сценарій використання - це новий сценарій розмови, а не новий продукт.
Результат розмови
Чим завершився дзвінок, в одному полі: кваліфікований, призначено передзвін, не зацікавлений, немає відповіді. За результатами ви фільтруєте, рахуєте й скеровуєте далі.
Витягання відповідей
Перетворення розмови на поля, з якими можна працювати: досі продає - так; строк - наступний місяць; ціна - 30 000. Кожен дзвінок повертає відповіді як дані, поруч із транскриптом і записом.
Guard rail
Правило, що визначає, що Адаму можна, а що ні - відрекомендуватися як ШІ, триматися теми, зупинитися тієї ж миті, коли хтось відмовляється. Стежить за цим платформа, а не сценарій.

Відповідність і приватність

Правила, за якими живуть дзвінки ШІ в ЄС - і як платформа їх тримає.

GDPR
Регламент ЄС про захист даних. Для даних розмов контролером є наш клієнт - це його ліди - а Adam Calling є процесором; платформний бік цього поділу (зберігання, видалення, експорт) вбудований.
Контролер і процесор
Хто вирішує, навіщо обробляються дані (контролер - наш клієнт), а хто обробляє їх за його вказівками (процесор - ми). Розрізнення, на якому GDPR тримає кожен обов’язок.
AI Act
Закон ЄС про ШІ. Серед іншого вимагає, щоб люди знали, що говорять зі ШІ - тому Адам представляється ШІ на початку кожної розмови.
Згода і опт-ін
Адам дзвонить людям, які погодилися на контакт. Списки згод і реєстри заборони дзвінків перевіряються до набору номера, а не після скарг.
Реєстр заборони дзвінків
Реєстр номерів, яким не можна дзвонити з маркетингом. Перевіряється до того, як кампанія почне набирати.
Резиденція даних
Де дані фізично живуть. В Адама: обчислення, сховище й база даних в AWS у Франкфурті; телефонія та обробка голосу в Європі; аналіз після розмови на європейських ендпоінтах моделей.
Зберігання
Як довго тримаються дані розмов. Записи - за замовчуванням 90 днів, строк ваш, а експорт чи видалення доступні завжди.
Шифрування
Записи й дані зашифровані у спокої у Франкфурті та в транзиті всюди. Стандартно, перевірювано, нудно - таким і має бути захист.
DPA (угода про обробку даних)
Договір, що закріплює обов’язки процесора з цієї сторінки. Доступний на запит: hello@adamcalling.com.