✅ 훈련받은, ✅ 100만 시간, ✅ 고유명사 인식 강화, ✅ 영숫자 인식 개선, ✅ 소음 견고성 향상, ✅ 모델 앙상블 활용, ✅ 처리 시간 단축, ✅ 감동받은 사용자, ✅ 지향적인 지표, ✅ 연설에 이상적, ✅ ~에게, ✅ 텍스트 전사, ✅ 모델 크기 대폭 향상, ✅ 대규모 언어 모델 최적화, ✅ 추론 대기 시간 감소
Conformer-2는 Conformer-1의 후속으로 개발된 첨단 자동 음성인식 AI 모델입니다.고유명사, 영숫자를 디코딩하고 시끄러운 환경에서 탁월한 성능을 발휘할 수 있도록 강력하게 개선되어 설계되었습니다.이는 대규모 영어 오디오 데이터에 대한 집중적인 훈련을 통해 달성되었습니다.Conformer-2의 장점은 Conformer-1에 비해 단어 오류율이 떨어지지 않으면서도 향상된 사용자 중심 메트릭을 제공한다는 것입니다.이전 버전과 비교하여 Conformer-2의 추가 개선은 훈련 데이터 양을 늘리고 의사 라벨 모델을 늘려 실현되었습니다.또한 추론 파이프라인을 수정하면 Conformer-2의 대기 시간이 줄어들어 전반적인 성능이 향상됩니다.Conformer-2의 또 다른 중요한 발전은 모델 앙상블을 활용하는 혁신적인 훈련 기술과 관련이 있습니다.단일 '교사'로부터만 레이블을 파생하는 대신 이 모델에서는 여러 '교사'로부터 레이블이 생성되므로 보다 다양하고 강력한 모델이 보장됩니다.이는 개별 모델 실패의 영향을 줄이는 효과가 있습니다.Conformer-2의 개발에는 데이터 및 모델 매개변수 스케일링에 대한 탐색, 모델 크기 증가, 교육 오디오 데이터 확장도 포함되었습니다.이러한 접근 방식은 대규모 언어 모델에 대한 'Chinchilla' 논문에서 확인된 충분히 활용되지 않은 잠재력을 일치시키는 것을 목표로 했습니다.이러한 업데이트를 통해 Conformer-2는 Conformer-1보다 더 빠른 응답 시간을 제공하여 더 큰 모델이 더 느리고 더 비싸지는 경향을 극복합니다.