دانلود مقاله ISI انگلیسی شماره 124391
ترجمه فارسی عنوان مقاله

تشخیص اصطلاحات حکم در رونوشت های خودکار گفتار به متن فرانسه

عنوان انگلیسی
Detection of Sentence Modality on French Automatic Speech-to-text Transcriptions
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
124391 2018 9 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Procedia Computer Science, Volume 128, 2018, Pages 38-46

ترجمه کلمات کلیدی
تشخیص سوال، رونوشت سخنرانی به متن، پرونده نسبت احتمال، برچسب های بخشی از گفتار
کلمات کلیدی انگلیسی
Question detection; speech-to-text transcriptions; prosody; likelihood ratio; part-of-speech tags;
ترجمه چکیده
در این مقاله، تشخیص نوع مدرک در فرانسوی زمانی که آن را در رونوشت های اتوماتیک گفتار به متن استفاده می شود. دو شیوه حکم (سوالات و اظهارات) با استفاده از اطلاعات اسناد و زبانی ارزیابی می شود. ویژگی های زبانشناسی، حضور الگوهای تکراری تبعیض آمیز و دو نسبت احتمال عددی بودن جمله را به عنوان یک سوال و نه یک بیانیه در نظر می گیرند: یکی براساس کلمات و دیگری بر مبنای تگ های بخشی از گفتار است. ویژگی های این نرم افزار براساس مدت زمان، انرژی و ویژگی های زمین برآورد شده در آخرین گروه فیشودیک از جمله است. طبقه بندی های مبتنی بر ویژگی های زبانی، طبقه بندی ها را براساس ویژگی های متنوعی فراتر می برند. ترکیبی از ویژگی های زبانشناختی و زبانی، بهبودی کمی در رونوشت های گفتاری اتوماتیک دارد، در حالیکه عملکرد طبقه بندی صحی به 72٪ می رسد. یک تحلیل دقیق نشان می دهد که اشتباهات کوچک در تعیین مرزهای بخش مهم نیست.
پیش نمایش مقاله
پیش نمایش مقاله  تشخیص اصطلاحات حکم در رونوشت های خودکار گفتار به متن فرانسه

چکیده انگلیسی

This article analyzes the detection of sentence modality in French when it is applied on automatic speech-to-text transcriptions. Two sentence modalities are evaluated (questions and statements) using prosodic and linguistic information. The linguistic features consider the presence of discriminative interrogative patterns and two log-likelihood ratios of the sentence being a question rather than a statement: one based on words and the other one based on part-of-speech tags. The prosodic features are based on duration, energy and pitch features estimated over the last prosodic group of the sentence. The classifiers based on linguistic features outperform the classifiers based on prosodic features. The combination of linguistic and prosodic features gives a slight improvement on automatic speech transcriptions, where the correct classification performance reaches 72%. A detailed analysis shows that small errors in the determination of the segment boundaries are not critical.