Ръководство за бърз старт
Готови сте да настроите първия си AI асистент? Ето основния процес:- Изберете посока на обаждането: Входящи (отговаря на обаждания) или изходящи (прави обаждания)
- Задайте име на асистента: Вътрешен етикет като “Support Bot” или “Sales Bot”
- Конфигурирайте телефонни номера: Назначете номера на платформата, SIP или Caller ID
- Изберете глас и език: Изберете от вградените гласове или клонирайте персонализирани такива
- Настройте разширени настройки: Фино настройте модели, времена и аудио параметри
Следвайте тази страница секция по секция, за да конфигурирате асистента си. Всяка настройка включва подробни обяснения и най-добри практики, които да ви помогнат да направите правилния избор.
Посока на обаждането и основна настройка
Тип асистент
Изберете дали асистентът ви обработва входящи или изходящи обаждания. Този основен избор влияе върху това кои други опции стават достъпни. Входящи (Получава обаждания): Обработва входящи обаждания от клиенти. Вижте Преглед на входящи обаждания. Изходящи (Прави обаждания): Започва обаждания към потенциални клиенти или клиенти. Вижте Преглед на изходящи обаждания.Име на асистента
Описателно име за идентифициране на асистента в таблото. Използвайте нещо запомнящо се, което описва целта на асистента (напр. “Sales Qualifier”, “Support Bot”, “Appointment Scheduler”).Конфигурация на телефонния номер
Асистентът ви се нуждае от телефонен номер за да функционира. Достъпните опции зависят от избора ви за посока на обаждането.За изходящи асистенти
Можете да използвате:- Номера на платформата: Номера, наети директно от нашата платформа
- SIP номера: Свържете съществуващата си VOIP/PBX система
- Само Caller ID: Потвърдете собственост върху съществуващ номер, за да го показвате при изходящи обаждания
За входящи асистенти
Можете да използвате:- Номера на платформата: Номера, наети директно от нашата платформа
- SIP номера: Свържете съществуващата си VOIP/PBX система
Ценообразуване и разходи
- Номера на платформата: Месечни такси за наем започвайки от $3.99/месец. Вижте наемане на специализиран номер за подробно ценообразуване.
- SIP интеграция: Без месечна такса, само $0.00045/мин за AI свързване. Вижте ценообразуване за SIP интеграция.
- Caller ID: Без месечна такса, регионални тарифи за минута (напр. $0.01/мин в САЩ). Вижте ценообразуване за Caller ID.
Тип двигател (режим за обработка на глас)
Изберете как вашият AI обработва речта и генерира отговори. Всеки режим е оптимизиран за различни случаи на употреба. Вижте Режими на асистента за подробни сравнения.Pipeline режим
Традиционен Speech-to-Text → LLM → Text-to-Speech pipeline. Предлага максимален контрол върху избора на глас и генерирането на отговори. Най-добър за: Сложни разсъждения, извикване на функции, изисквания за персонализиран гласSpeech-to-Speech режим
Директно генериране от реч към реч без междинна текстова обработка. Осигурява най-естествения разговорен поток. Най-добър за: Бързи разговори, естествен диалог напред-назадDualplex режим (Beta)
Комбинира бърза мултимодална обработка с премиум ElevenLabs гласов изход. Най-добър за: Повечето случаи на употреба - препоръчана настройка по подразбиранеКонфигурация на езика
Основен език
Основният език, който асистентът ви ще използва за разпознаване на реч и синтез. Това влияе върху:- Точността на разпознаването на реч
- Достъпните гласови опции
- Фразите за запълване на аудиото
- Избора на гласов модел
Вторични езици
Допълнителни езици, които асистентът ви може да разбира и говори. Полезно за:- Многоезична клиентска поддръжка
- Международни бизнеси
- Разговори с превключване на кодове
TTS доставчик и избор на глас
TTS доставчик
Изберете вашия Text-to-Speech доставчик. Достъпен в Pipeline и Dualplex режими. Достъпни доставчици:- ElevenLabs - Висококачествени гласове
- Cartesia - Бърз синтез с ниска латентност
Гласови опции
Имате три начина да получите перфектния глас за асистента си: 1. Изберете от съществуващи гласове:- Професионални гласове: Предварително обучени, висококачествени опции от ElevenLabs
- Множество акценти: Достъпни за повечето езици
- Опции за пол: Мъжки и женски гласове за всеки език
- Разнообразие в тона: От формален бизнес до непринуден разговорен
- Cartesia - Единичен аудио файл, поне 10 секунди, 1 говорещ, без фонов шум
- ElevenLabs - Примери над 1 минута, 1 говорещ, без фонов шум. Максимум 5 минути общо.
- Кликнете “Clone voice” до селектора за глас
- Изберете доставчик (Cartesia или ElevenLabs)
- Изберете езика на гласа
- Въведете име за гласа си
- Запишете или качете аудио
- Изчакайте обработката
- Изберете новия си глас от падащото меню
- Съгласуваност на марката с говорител на компанията
- Личен подход за клиентски отношения
- Съответствие на гласа с конкретна бизнес личност
Конфигурация на часовата зона
Часова зона
Задайте часовата зона, в която работи асистентът ви. Това влияе върху:- Променливи, базирани на време в разговорите
- Функции за планиране на срещи
- Препратки към “текущото време” в системните подсказки
- Времеви печати в логовете на обажданията и извлечените данни
Настройки за подобряване на аудиото
Околен звук
Опционален фонов звук, смесен под гласа на асистента ви, за да маскира забавянията в обработката и да създаде по-естествено аудио изживяване. Опции:- Няма: Без фонов звук (по подразбиране)
- Офис: Деликатни звуци от офисна среда
Filler Audio
Кратки разговорни фрази като “мхм”, “добре”, “разбирам”, които се възпроизвеждат по време на обработка от AI. Вижте Ръководство за filler audio за пълни подробности.Ползи
- Елиминира неудобните тишини по време на обработка
- Поддържа обажданията се ангажирани
- Създава по-естествен разговорен поток
- Намалява честотата на затварянето
Положителни отговори
Положителни отговори
“Страхотно!”, “Перфектно!”, “Супер!”
Отрицателни отговори
Отрицателни отговори
“Хмм.”, “Виждам.”, “Добре.”
Отговори на въпроси
Отговори на въпроси
“Нали?”, “Наистина ли?”, “Как така?”
Неутрални отговори
Неутрални отговори
“Добре.”, “Разбирам.”, “Схванах.”
Активирайте по подразбиране - повечето разговори се възползват от fillers. Тествайте с целевата си аудитория и настройте фразите, за да съответстват на личността на асистента ви.
Разширени настройки
Избор на LLM модел
Изберете най-добрия езиков модел за режима на асистента ви. Вижте Ръководство за избор на LLM модел за подробни препоръки. Препоръчани модели по режим:| Модел | Силни страни | Най-добър за |
|---|---|---|
| GPT-5 Mini | Балансирани разсъждения с ниска латентност | Pipeline режим за сложни разсъждения |
| GPT-5 Realtime | Ултра-ниска латентност при гласови обрати | Speech-to-Speech и Dualplex |
| GPT-4o | Силни разсъждения и мултимодално разбиране | Сложни задачи (по-висока латентност) |
| Gemini Flash 2.0/2.5 | Ултра-бърз за гласови обрати | Dualplex/Multimodal за минимална латентност |
- Скоростта е критична: Използвайте GPT-5 Realtime или Gemini Flash 2.0/2.5
- Нужни са богати разсъждения: Използвайте GPT-4o или GPT-5 Mini с filler audios за компенсиране на латентността
LLM Temperature
Обхват: 0.0 - 1.0 | По подразбиране: 0.1 Настройте нивото на креативност на AI при генериране на отговори. По-ниската стойност дава по-добри резултати при извикване на функции.По-ниска (0.0-0.3)
По-стабилна: Предсказуеми отговори, по-добра за извикване на функции и бизнес случаи
По-висока (0.7-1.0)
По-случайна: Креативни и разнообразни отговори, добра за непринудени разговори
Специално поведение: За GPT-5 Mini и GPT-5 Nano модели в Pipeline режим, temperature автоматично се задава на 1.0 за оптимална производителност.
Настройки за продължителност
Контролирайте времето и лимитите на обажданията за оптимизиране на потребителското изживяване и разходите:Интервал за повторно ангажиране
Интервал за повторно ангажиране
Обхват: 7 - 600 секунди | По подразбиране: 30 секундиAI ще се опита да ангажира отново потребителя, ако не се засече отговор в рамките на това време.Препоръчително: 30-60 секунди за професионални обаждания.
Подсказка за повторно ангажиране
Подсказка за повторно ангажиране
Персонализирана подсказка, използвана когато AI се опитва да ангажира отново потребителя след тишина.По подразбиране: Използва стандартна фраза за повторно ангажиране като “Все още ли сте там?”Персонализиране: Напишете подсказка, която инструктира AI как да ангажира отново.Примери:
- “Деликатно попитай дали все още са там и дали имат нужда от повече време.”
- “Учтиво провери дали имат някакви въпроси.”
Максимална продължителност на обаждането
Максимална продължителност на обаждането
Обхват: 20 - 1200 секунди | По подразбиране: 600 секунди (10 минути)Обаждането ще се прекрати автоматично, ако се достигне тази стойност.Препоръчително: 5-10 минути за квалификация на потенциални клиенти за контрол на разходите.
Максимална продължителност на тишината
Максимална продължителност на тишината
Обхват: 1 - 120 секунди | По подразбиране: 40 секундиОбаждането ще се прекрати, ако потребителят не отговори в рамките на това време.Препоръчително: 30-45 секунди за баланс между търпение и ефективност.
Време на звънене
Време на звънене
Обхват: 1 - 60 секунди | По подразбиране: 30 секундиКолко дълго ще звъни обаждането преди да се маркира като неотговорено. Добро когато искате да избегнете гласовата поща чрез задаване на по-ниска стойност.
Настройки за защита на обажданията
Потискане на шум
Потискане на шум
По подразбиране: АктивираноФилтрира фоновия шум на обаждащия се за по-ясно разпознаване на речта. ИЗКЛЮЧЕТЕ, ако изпитвате отрязване на аудиото.
Прекратяване на обаждането при гласова поща
Прекратяване на обаждането при гласова поща
По подразбиране: АктивираноНезабавно прекратява обаждането, ако се засече гласова поща при изходящи обаждания (икономисва разходи).
Съобщение за гласова поща
Съобщение за гласова поща
Подсказка за съобщението, което AI ще каже когато се засече гласова поща преди да прекрати обаждането.По подразбиране: Празно (затваря веднага без да оставя съобщение)Случай на употреба: Оставете кратко съобщение преди затваряне, така че получателят да знае кой е звънял.Пример: “Остави кратко съобщение в гласовата поща, че си се обадил и ги помоли да се обадят обратно.”
Приложимо само когато “Прекратяване на обаждането при гласова поща” е активирано. Оставете празно за затваряне без съобщение.
Записване на обаждания
Записване на обаждания
По подразбиране: АктивираноЗаписва аудиото на обаждането за преглед и анализ. Осигурете съответствие с местните закони за записване.
Максимална начална тишина
Максимална начална тишина
Обхват: 1 - 120 секунди | По подразбиране: 20 секунди (когато е активирано)Ако е активирано, прекратява обаждането, ако няма първи потребителски отговор в рамките на това време. Брои само от започването на обаждането до първия потребителски отговор.Случай на употреба: Засичане дали някой наистина е отговорил на телефона.
Настройки на синтезатора
Конфигурирайте параметрите на text-to-speech гласа за естествено звучащи разговори. Достъпно за: Само Pipeline и Dualplex режими. Speech-to-Speech режимът използва натуално генериране на глас.Параметри за настройка на гласа
Фино настройте гласовите характеристики на асистента ви за оптимална производителност:TTS Emotion
TTS Emotion
По подразбиране: АктивираноКогато е активирано, AI ще добави емоционални сигнали към синтезираната реч въз основа на контекста на разговора. Това прави гласа да звучи по-естествено и изразително.Ефекти:
- Настройва тона въз основа на контекста на разговора (щастлив, загрижен, съпричастен)
- Добавя естествени интонации и ударения
- Кара асистента да звучи по-човешки
Деактивирайте, ако предпочитате по-неутрален, последователен тон във всички разговори.
Стабилност на гласа
Стабилност на гласа
Обхват: 0.0 - 1.0 | По подразбиране: 0.7По-ниските настройки правят гласа по-изразителен, но по-малко предсказуем, докато по-високите настройки го правят по-устойчив, но по-малко емоционален.
По-изразителен (0.0-0.3)
Динамично и разнообразно произнасяне, но по-малко предсказуемо
По-стабилен (0.7-1.0)
Последователен и устойчив, но с по-малко емоционален обхват
Сходство на гласа
Сходство на гласа
Обхват: 0.0 - 1.0 | По подразбиране: 0.5Определя колко близо AI съответства на оригиналния глас. По-високите настройки потенциално включват нежелан шум от оригиналния запис.
По-стабилен (0.0-0.4)
По-чисто аудио, но по-малко точно спрямо оригиналния глас
По-сходен (0.6-1.0)
Точен спрямо оригинала, но може да включва фонов шум
Скорост на речта
Скорост на речта
Обхват: 0.7 - 1.2 | По подразбиране: 1.0Настройте скоростта на речта на AI за оптимално разбиране и потребителско изживяване.
По-бавно (0.7-0.85)
По-добро за сложна информация или по-възрастни демографии
Нормално (0.9-1.1)
Стандартно разговорно темпо за повечето случаи
По-бързо (1.15-1.2)
Бързи разговори или сценарии, чувствителни към времето
Настройки на транскрибатора
Конфигурирайте разпознаването speech-to-text за оптимална точност и скорост. Достъпно за: Само Pipeline режим. Speech-to-Speech и Dualplex режимите използват интегрирана транскрипция.Избор на доставчик
Изберете най-добрия транскрибатор за вашия език и случай на употреба. Доставчикът, който ще бъде използван за транскрибиране на потребителската реч.Azure
Точност: ⭐⭐⭐⭐
Латентност: По-бавнаНай-добър за най-висока точност на транскрипцията, когато точността е критична.
Gladia
Точност: ⭐⭐⭐
Латентност: По-бързаДобър универсален за повечето езици. Поддържа многоезични конфигурации.
Deepgram
Точност: ⭐⭐⭐
Латентност: По-бързаСолиден избор за английски и основни езици.
Различните езици, акценти или фонов шум могат да повлияят по

