✅ 다중 언어 인식, ✅ 대용량 연속 음성 인식, ✅ 진짜, ✅ 시간 및 배치 모드, ✅ 오디오 세분화 기능, ✅ 분할 기능, ✅ 화자 식별, ✅ 언어 식별, ✅ 웹 서비스 가용성, ✅ 연설, ✅, ✅ 텍스트 API, ✅ 전체 음성 전사, ✅ 오디오 인덱싱, ✅ 연설
Vocapia는 음성을 텍스트로 변환하는 소프트웨어 및 서비스 제공업체로, 그 중 대표적인 것이 VoxSigma 소프트웨어 제품군입니다.방송 모니터링, 세미나 전사, 비디오 자막, 전화 회의 전사 및 음성 분석을 포함한 여러 애플리케이션에 적합합니다.고급 AI 및 기계 학습 방법을 활용하는 이 플랫폼에서는 대규모 어휘 연속 음성 인식, 자동 오디오 분할, 언어 식별, 화자 분할 및 오디오-텍스트 동기화가 가능합니다.VoxSigma 제품군은 방송 데이터, 의회 청문회, 대화 데이터를 비롯한 다양한 언어 유형과 다양한 오디오 데이터 유형에 널리 적용 가능합니다.이는 대화식 전화 음성 및 콜센터 데이터를 전사하기 위해 생성된 특정 버전을 사용하여 일괄 모드 또는 실시간으로 상당한 양의 오디오 및 비디오 문서를 전사하려는 전문 사용자를 위해 설계되었습니다.또한 이 제품군은 VoxSigma SaaS를 사용하는 웹 서비스로서 REST API를 통해 전사, 오디오 인덱싱 및 음성 텍스트 정렬 기능을 제공합니다.이 기술을 사용하면 오디오 및 비디오 문서의 콘텐츠 기반 정보 액세스가 가능해 다운스트림 처리가 최적화되고 오디오 문서의 관련 부분에 직접 액세스할 수 있습니다.또한 이 소프트웨어는 82개 언어 집합의 언어 식별, 시청각 데이터 마이닝, 음성 분석 및 미디어 자산 관리를 지원합니다.