Глосарій voice AI
Терміни голосового ШІ, телефонії та панелі Адама - що вони означають і що Адам з ними робить.
Голос і мовлення
Аудіомашинерія, на якій працює кожен дзвінок зі ШІ.
- ASR (автоматичне розпізнавання мовлення)
- Система, що на льоту перетворює мову співрозмовника на текст. Інакше speech-to-text. Її точність - стеля для всього далі, і міряють її коефіцієнтом WER на справжньому записі розмови. Працює в реальному часі, видаючи слова ще до того, як співрозмовник договорить речення - і це перше, що ми налаштовуємо для кожної мови, польську найретельніше.
- STT (speech-to-text)
- Те саме, що ASR, під назвою, якою частіше користуються хмарні платформи. В Адама входить у ціну за хвилину - без окремого постачальника мовлення, якого треба підключати й оплачувати.
- TTS (синтез мовлення)
- Система, що перетворює слова Адама на голос у слухавці. Оцінюється за природністю, просодією і тим, як швидко з’являється перший звук. Кожна мова отримує природний голос, налаштований під неї, а не загальний, приклеєний збоку.
- Клонування голосу
- Створення синтетичного голосу з короткого запису реальної людини. Адам не клонує ваших працівників - кожна мова отримує власний природний голос, щоб польська звучала по-польськи, а не як переклад.
- Затримка
- Проміжок між кінцем фрази співрозмовника і початком відповіді Адама. Нижче приблизно 400 мілісекунд звучить як звичайна розмова; понад секунду - люди відчувають затримку й вимикаються. Тримати її низькою - більшість інженерії голосового агента.
- Barge-in
- Коли співрозмовник перебиває Адама на півслові. Продакшн-агент має вловити це десь за 150 мілісекунд, чисто замовкнути й сприйняти перебивання як справжню відповідь. Люди постійно перебивають телефонні розмови, тож це базова вимога.
- VAD (детекція голосової активності)
- Компонент, який вирішує, що співрозмовник договорив. Налаштування - це компроміс між чуйністю - вступити зарано - і терплячістю - перечекати паузу посеред речення. Погане налаштування - найчастіша причина, чому агенти перебивають людей.
- Визначення черги
- Ширше судження, чия черга говорити - VAD плюс контекст того, що вже сказано. Добре чергування - різниця між розмовою і двома монологами, що розминаються в повітрі.
- Діаризація
- Розрізнення, хто що сказав, коли на лінії більше ніж одна людина. Тримає транскрипт у порядку й підказує Адаму, якому голосу відповідати.
- WER (word error rate)
- Стандартна міра точності розпізнавання мовлення: слова, почуті неправильно, загублені чи вигадані, на тлі всього сказаного. Що нижче, то краще. Шумні лінії та власні назви піднімають показник; чистий запис тримає його в межах однієї цифри.
Телефонія
Як дзвінок доходить до телефона.
- PSTN
- Публічна комутована телефонна мережа - глобальна система, на якій тримається кожен мобільний і стаціонарний. Дзвінки Адама - звичайні дзвінки в ній: дзвонить справжній телефон, без жодного застосунку.
- SIP
- Session initiation protocol - спосіб встановлювати, вести й завершувати дзвінки через інтернет. Сантехніка сучасної телефонії.
- SIP trunking
- Передавання дзвінків до й від телефонної системи через SIP замість фізичних ліній - те, як бізнес підключає свою телефонію до зовнішньої мережі.
- E.164
- Міжнародний формат номера: плюс, код країни, номер, без пробілів - +48512345678. Формат, якого очікують імпорт лідів і API Адама.
- Caller ID
- Номер, який видно на телефоні, що дзвонить. Адам дзвонить зі справжніх, виділених номерів - не з анонімних чи підмінених.
- DTMF
- Тони клавіатури телефона - сигнали «натисніть 1», на яких працюють старі телефонні меню.
- IVR
- Interactive voice response - дерево меню, яке більшість уявляє, почувши «автоматичний дзвінок». Розмовні агенти на кшталт Адама замінюють меню звичайною розмовою.
- Розпізнавання автовідповідача
- Відрізнити живе «алло?» від голосової пошти в перші секунди дзвінка. Від цього залежить, чи Адам веде розмову, чи ввічливо планує повторну спробу.
- Тепла передача
- Передати співрозмовника людині разом із контекстом, а не холодним трансфером. В Адама це гаряча черга: лід, транскрипт і причина, чому він гарячий, чекають на дзвінок людини.
- Паралельні дзвінки
- Скільки дзвінків триває одночасно. Визначає, як швидко кампанія опрацьовує список - ліди ведуться паралельно, а не один за одним.
Платформа Adam
Слова з панелі Адама.
- Сценарій розмови (pathway)
- Спроєктована розмова: з чого Адам починає, що питає, як реагує, коли завершує. Новий сценарій використання - це новий сценарій розмови, а не новий продукт.
- Результат розмови
- Чим завершився дзвінок, в одному полі: кваліфікований, призначено передзвін, не зацікавлений, немає відповіді. За результатами ви фільтруєте, рахуєте й скеровуєте далі.
- Витягання відповідей
- Перетворення розмови на поля, з якими можна працювати: досі продає - так; строк - наступний місяць; ціна - 30 000. Кожен дзвінок повертає відповіді як дані, поруч із транскриптом і записом.
- Guard rail
- Правило, що визначає, що Адаму можна, а що ні - відрекомендуватися як ШІ, триматися теми, зупинитися тієї ж миті, коли хтось відмовляється. Стежить за цим платформа, а не сценарій.
Відповідність і приватність
Правила, за якими живуть дзвінки ШІ в ЄС - і як платформа їх тримає.
- GDPR
- Регламент ЄС про захист даних. Для даних розмов контролером є наш клієнт - це його ліди - а Adam Calling є процесором; платформний бік цього поділу (зберігання, видалення, експорт) вбудований.
- Контролер і процесор
- Хто вирішує, навіщо обробляються дані (контролер - наш клієнт), а хто обробляє їх за його вказівками (процесор - ми). Розрізнення, на якому GDPR тримає кожен обов’язок.
- AI Act
- Закон ЄС про ШІ. Серед іншого вимагає, щоб люди знали, що говорять зі ШІ - тому Адам представляється ШІ на початку кожної розмови.
- Згода і опт-ін
- Адам дзвонить людям, які погодилися на контакт. Списки згод і реєстри заборони дзвінків перевіряються до набору номера, а не після скарг.
- Реєстр заборони дзвінків
- Реєстр номерів, яким не можна дзвонити з маркетингом. Перевіряється до того, як кампанія почне набирати.
- Резиденція даних
- Де дані фізично живуть. В Адама: обчислення, сховище й база даних в AWS у Франкфурті; телефонія та обробка голосу в Європі; аналіз після розмови на європейських ендпоінтах моделей.
- Зберігання
- Як довго тримаються дані розмов. Записи - за замовчуванням 90 днів, строк ваш, а експорт чи видалення доступні завжди.
- Шифрування
- Записи й дані зашифровані у спокої у Франкфурті та в транзиті всюди. Стандартно, перевірювано, нудно - таким і має бути захист.
- DPA (угода про обробку даних)
- Договір, що закріплює обов’язки процесора з цієї сторінки. Доступний на запит: hello@adamcalling.com.