Skip to main content
Конфигурирайте основните настройки за вашия AI асистент, включително посока на обажданията, телефонни номера, избор на глас и технически параметри.

Ръководство за бърз старт

Готови сте да настроите първия си AI асистент? Ето основния процес:
  1. Изберете посока на обаждането: Входящи (отговаря на обаждания) или изходящи (прави обаждания)
  2. Задайте име на асистента: Вътрешен етикет като “Support Bot” или “Sales Bot”
  3. Конфигурирайте телефонни номера: Назначете номера на платформата, SIP или Caller ID
  4. Изберете глас и език: Изберете от вградените гласове или клонирайте персонализирани такива
  5. Настройте разширени настройки: Фино настройте модели, времена и аудио параметри
Винаги тествайте промените си като се обадите на асистента или стартирате малка кампания, за да потвърдите, че се държи според очакванията.
Следвайте тази страница секция по секция, за да конфигурирате асистента си. Всяка настройка включва подробни обяснения и най-добри практики, които да ви помогнат да направите правилния избор.

Посока на обаждането и основна настройка

Тип асистент

Изберете дали асистентът ви обработва входящи или изходящи обаждания. Този основен избор влияе върху това кои други опции стават достъпни. Входящи (Получава обаждания): Обработва входящи обаждания от клиенти. Вижте Преглед на входящи обаждания. Изходящи (Прави обаждания): Започва обаждания към потенциални клиенти или клиенти. Вижте Преглед на изходящи обаждания.

Име на асистента

Описателно име за идентифициране на асистента в таблото. Използвайте нещо запомнящо се, което описва целта на асистента (напр. “Sales Qualifier”, “Support Bot”, “Appointment Scheduler”).

Конфигурация на телефонния номер

Асистентът ви се нуждае от телефонен номер за да функционира. Достъпните опции зависят от избора ви за посока на обаждането.

За изходящи асистенти

Можете да използвате:
  • Номера на платформата: Номера, наети директно от нашата платформа
  • SIP номера: Свържете съществуващата си VOIP/PBX система
  • Само Caller ID: Потвърдете собственост върху съществуващ номер, за да го показвате при изходящи обаждания

За входящи асистенти

Можете да използвате:
  • Номера на платформата: Номера, наети директно от нашата платформа
  • SIP номера: Свържете съществуващата си VOIP/PBX система
Забележка: Номерата само за Caller ID не могат да обработват входящи обаждания - те се показват само при изходящи обаждания.

Ценообразуване и разходи

Вижте Типове телефонни номера за подробни обяснения и ръководство за SIP интеграция за VOIP настройка.

Тип двигател (режим за обработка на глас)

Изберете как вашият AI обработва речта и генерира отговори. Всеки режим е оптимизиран за различни случаи на употреба. Вижте Режими на асистента за подробни сравнения.

Pipeline режим

Традиционен Speech-to-Text → LLM → Text-to-Speech pipeline. Предлага максимален контрол върху избора на глас и генерирането на отговори. Най-добър за: Сложни разсъждения, извикване на функции, изисквания за персонализиран глас

Speech-to-Speech режим

Директно генериране от реч към реч без междинна текстова обработка. Осигурява най-естествения разговорен поток. Най-добър за: Бързи разговори, естествен диалог напред-назад

Dualplex режим (Beta)

Комбинира бърза мултимодална обработка с премиум ElevenLabs гласов изход. Най-добър за: Повечето случаи на употреба - препоръчана настройка по подразбиране

Конфигурация на езика

Основен език

Основният език, който асистентът ви ще използва за разпознаване на реч и синтез. Това влияе върху:
  • Точността на разпознаването на реч
  • Достъпните гласови опции
  • Фразите за запълване на аудиото
  • Избора на гласов модел
Вижте Поддръжка на езици за всички достъпни езици и акценти.

Вторични езици

Допълнителни езици, които асистентът ви може да разбира и говори. Полезно за:
  • Многоезична клиентска поддръжка
  • Международни бизнеси
  • Разговори с превключване на кодове
Забележка: AI може да засече кой език говори клиентът и да отговори подходящо.

TTS доставчик и избор на глас

TTS доставчик

Изберете вашия Text-to-Speech доставчик. Достъпен в Pipeline и Dualplex режими. Достъпни доставчици:
  • ElevenLabs - Висококачествени гласове
  • Cartesia - Бърз синтез с ниска латентност
Асистентът ви може да избира от съществуващи гласове, да клонира персонализирани гласове или да заяви гласове от библиотеката на ElevenLabs.

Гласови опции

Имате три начина да получите перфектния глас за асистента си: 1. Изберете от съществуващи гласове:
  • Професионални гласове: Предварително обучени, висококачествени опции от ElevenLabs
  • Множество акценти: Достъпни за повечето езици
  • Опции за пол: Мъжки и женски гласове за всеки език
  • Разнообразие в тона: От формален бизнес до непринуден разговорен
2. Клонирайте персонализиран глас: Създайте персонализиран глас чрез качване на аудио примери. Достъпно в Pipeline и Dualplex режими. Изисквания по доставчик:
  • Cartesia - Единичен аудио файл, поне 10 секунди, 1 говорещ, без фонов шум
  • ElevenLabs - Примери над 1 минута, 1 говорещ, без фонов шум. Максимум 5 минути общо.
Процес:
  1. Кликнете “Clone voice” до селектора за глас
  2. Изберете доставчик (Cartesia или ElevenLabs)
  3. Изберете езика на гласа
  4. Въведете име за гласа си
  5. Запишете или качете аудио
  6. Изчакайте обработката
  7. Изберете новия си глас от падащото меню
Случаи на употреба:
  • Съгласуваност на марката с говорител на компанията
  • Личен подход за клиентски отношения
  • Съответствие на гласа с конкретна бизнес личност
3. Заявете от библиотеката на ElevenLabs: Можете да заявите конкретни гласове от публичната библиотека на ElevenLabs - свържете се с поддръжката, за да ги добавят към профила ви. Прегледайте Гласовата библиотека на ElevenLabs, за да откриете хиляди професионални гласове на различни езици, акценти и случаи на употреба. Вижте Ръководство за избор на глас за подробни инструкции за настройка.

Конфигурация на часовата зона

Часова зона

Задайте часовата зона, в която работи асистентът ви. Това влияе върху:
  • Променливи, базирани на време в разговорите
  • Функции за планиране на срещи
  • Препратки към “текущото време” в системните подсказки
  • Времеви печати в логовете на обажданията и извлечените данни
Важно: Изберете часовата зона, където работи бизнесът ви или където се намират повечето клиенти. Асистентът ще я използва за всички изчисления или планиране, свързани с времето.

Настройки за подобряване на аудиото

Околен звук

Опционален фонов звук, смесен под гласа на асистента ви, за да маскира забавянията в обработката и да създаде по-естествено аудио изживяване. Опции:
  • Няма: Без фонов звук (по подразбиране)
  • Офис: Деликатни звуци от офисна среда
Контрол на силата: Настройте нивото на околния звук спрямо гласа. По-ниските стойности обикновено са по-добри - твърде много фонов звук може да пречи на разпознаването на реч.
Изключете или намалете силата, ако асистентът не чува ясно клиента.

Filler Audio

Кратки разговорни фрази като “мхм”, “добре”, “разбирам”, които се възпроизвеждат по време на обработка от AI. Вижте Ръководство за filler audio за пълни подробности.

Ползи

  • Елиминира неудобните тишини по време на обработка
  • Поддържа обажданията се ангажирани
  • Създава по-естествен разговорен поток
  • Намалява честотата на затварянето
Конфигурация, осведомена за езика: Filler фразите се задават автоматично за избрания от вас език:
“Страхотно!”, “Перфектно!”, “Супер!”
“Хмм.”, “Виждам.”, “Добре.”
“Нали?”, “Наистина ли?”, “Как така?”
“Добре.”, “Разбирам.”, “Схванах.”
Персонализиране: Можете да редактирате фразите по подразбиране за всяка категория, за да съответстват на гласа на марката ви или регионалните предпочитания.
Активирайте по подразбиране - повечето разговори се възползват от fillers. Тествайте с целевата си аудитория и настройте фразите, за да съответстват на личността на асистента ви.

Разширени настройки

Избор на LLM модел

Изберете най-добрия езиков модел за режима на асистента ви. Вижте Ръководство за избор на LLM модел за подробни препоръки. Препоръчани модели по режим:
МоделСилни страниНай-добър за
GPT-5 MiniБалансирани разсъждения с ниска латентностPipeline режим за сложни разсъждения
GPT-5 RealtimeУлтра-ниска латентност при гласови обратиSpeech-to-Speech и Dualplex
GPT-4oСилни разсъждения и мултимодално разбиранеСложни задачи (по-висока латентност)
Gemini Flash 2.0/2.5Ултра-бърз за гласови обратиDualplex/Multimodal за минимална латентност
Ръководство за бърз избор:
  • Скоростта е критична: Използвайте GPT-5 Realtime или Gemini Flash 2.0/2.5
  • Нужни са богати разсъждения: Използвайте GPT-4o или GPT-5 Mini с filler audios за компенсиране на латентността

LLM Temperature

Обхват: 0.0 - 1.0 | По подразбиране: 0.1 Настройте нивото на креативност на AI при генериране на отговори. По-ниската стойност дава по-добри резултати при извикване на функции.

По-ниска (0.0-0.3)

По-стабилна: Предсказуеми отговори, по-добра за извикване на функции и бизнес случаи

По-висока (0.7-1.0)

По-случайна: Креативни и разнообразни отговори, добра за непринудени разговори
Специално поведение: За GPT-5 Mini и GPT-5 Nano модели в Pipeline режим, temperature автоматично се задава на 1.0 за оптимална производителност.

Настройки за продължителност

Контролирайте времето и лимитите на обажданията за оптимизиране на потребителското изживяване и разходите:
Обхват: 7 - 600 секунди | По подразбиране: 30 секундиAI ще се опита да ангажира отново потребителя, ако не се засече отговор в рамките на това време.Препоръчително: 30-60 секунди за професионални обаждания.
Персонализирана подсказка, използвана когато AI се опитва да ангажира отново потребителя след тишина.По подразбиране: Използва стандартна фраза за повторно ангажиране като “Все още ли сте там?”Персонализиране: Напишете подсказка, която инструктира AI как да ангажира отново.Примери:
  • “Деликатно попитай дали все още са там и дали имат нужда от повече време.”
  • “Учтиво провери дали имат някакви въпроси.”
Променливи като {customer_name} не могат да бъдат вмъкнати директно в тази подсказка. AI има достъп до историята на разговора и основната системна подсказка, така че може да се позове на информация оттам.
Оставете празно за използване на поведението за повторно ангажиране по подразбиране.
Обхват: 20 - 1200 секунди | По подразбиране: 600 секунди (10 минути)Обаждането ще се прекрати автоматично, ако се достигне тази стойност.Препоръчително: 5-10 минути за квалификация на потенциални клиенти за контрол на разходите.
Обхват: 1 - 120 секунди | По подразбиране: 40 секундиОбаждането ще се прекрати, ако потребителят не отговори в рамките на това време.Препоръчително: 30-45 секунди за баланс между търпение и ефективност.
Обхват: 1 - 60 секунди | По подразбиране: 30 секундиКолко дълго ще звъни обаждането преди да се маркира като неотговорено. Добро когато искате да избегнете гласовата поща чрез задаване на по-ниска стойност.
Оптимизация на разходите: По-ниските лимити за продължителност помагат да контролирате разходите за минута, особено важно за кампании с голям обем.

Настройки за защита на обажданията

По подразбиране: АктивираноФилтрира фоновия шум на обаждащия се за по-ясно разпознаване на речта. ИЗКЛЮЧЕТЕ, ако изпитвате отрязване на аудиото.
По подразбиране: АктивираноНезабавно прекратява обаждането, ако се засече гласова поща при изходящи обаждания (икономисва разходи).
Подсказка за съобщението, което AI ще каже когато се засече гласова поща преди да прекрати обаждането.По подразбиране: Празно (затваря веднага без да оставя съобщение)Случай на употреба: Оставете кратко съобщение преди затваряне, така че получателят да знае кой е звънял.Пример: “Остави кратко съобщение в гласовата поща, че си се обадил и ги помоли да се обадят обратно.”
Променливи като {company_name} не могат да бъдат вмъкнати директно в тази подсказка. AI има достъп до историята на разговора и основната системна подсказка, така че може да се позове на информация оттам.
Приложимо само когато “Прекратяване на обаждането при гласова поща” е активирано. Оставете празно за затваряне без съобщение.
По подразбиране: АктивираноЗаписва аудиото на обаждането за преглед и анализ. Осигурете съответствие с местните закони за записване.
Обхват: 1 - 120 секунди | По подразбиране: 20 секунди (когато е активирано)Ако е активирано, прекратява обаждането, ако няма първи потребителски отговор в рамките на това време. Брои само от започването на обаждането до първия потребителски отговор.Случай на употреба: Засичане дали някой наистина е отговорил на телефона.

Настройки на синтезатора

Конфигурирайте параметрите на text-to-speech гласа за естествено звучащи разговори. Достъпно за: Само Pipeline и Dualplex режими. Speech-to-Speech режимът използва натуално генериране на глас.

Параметри за настройка на гласа

Фино настройте гласовите характеристики на асистента ви за оптимална производителност:
По подразбиране: АктивираноКогато е активирано, AI ще добави емоционални сигнали към синтезираната реч въз основа на контекста на разговора. Това прави гласа да звучи по-естествено и изразително.Ефекти:
  • Настройва тона въз основа на контекста на разговора (щастлив, загрижен, съпричастен)
  • Добавя естествени интонации и ударения
  • Кара асистента да звучи по-човешки
Деактивирайте, ако предпочитате по-неутрален, последователен тон във всички разговори.
Обхват: 0.0 - 1.0 | По подразбиране: 0.7По-ниските настройки правят гласа по-изразителен, но по-малко предсказуем, докато по-високите настройки го правят по-устойчив, но по-малко емоционален.

По-изразителен (0.0-0.3)

Динамично и разнообразно произнасяне, но по-малко предсказуемо

По-стабилен (0.7-1.0)

Последователен и устойчив, но с по-малко емоционален обхват
Обхват: 0.0 - 1.0 | По подразбиране: 0.5Определя колко близо AI съответства на оригиналния глас. По-високите настройки потенциално включват нежелан шум от оригиналния запис.

По-стабилен (0.0-0.4)

По-чисто аудио, но по-малко точно спрямо оригиналния глас

По-сходен (0.6-1.0)

Точен спрямо оригинала, но може да включва фонов шум
За клонирани гласове: Започнете от 0.5 и увеличавайте постепенно. По-високото сходство може да въведе нежелани артефакти от оригиналния запис.
Обхват: 0.7 - 1.2 | По подразбиране: 1.0Настройте скоростта на речта на AI за оптимално разбиране и потребителско изживяване.

По-бавно (0.7-0.85)

По-добро за сложна информация или по-възрастни демографии

Нормално (0.9-1.1)

Стандартно разговорно темпо за повечето случаи

По-бързо (1.15-1.2)

Бързи разговори или сценарии, чувствителни към времето

Настройки на транскрибатора

Конфигурирайте разпознаването speech-to-text за оптимална точност и скорост. Достъпно за: Само Pipeline режим. Speech-to-Speech и Dualplex режимите използват интегрирана транскрипция.

Избор на доставчик

Изберете най-добрия транскрибатор за вашия език и случай на употреба. Доставчикът, който ще бъде използван за транскрибиране на потребителската реч.

Azure

Точност: ⭐⭐⭐⭐ Латентност: По-бавнаНай-добър за най-висока точност на транскрипцията, когато точността е критична.

Gladia

Точност: ⭐⭐⭐ Латентност: По-бързаДобър универсален за повечето езици. Поддържа многоезични конфигурации.

Deepgram

Точност: ⭐⭐⭐ Латентност: По-бързаСолиден избор за английски и основни езици.
Различните езици, акценти или фонов шум могат да повлияят по