قیمت: 15,000 تومان

دانلود رایگان اصل مقاله

نام فارسی

بهبود یادگیری نظارتی برای خلاصه سازی جلسه با استفاده از نمونه گیری و رگرسیون

نام لاتین

Improving supervised learning for meeting summarization using sampling and regression

مشخصات کلی

سال انتشار سال 2010
کد 1606
فرمت فایل word
تعداد صفحات ترجمه 26
اصل مقاله لاتین رایگان است
منبع ScienceDirect
نام مجله Computer Speech and Language

چکیده فارسی

خلاصه سازی جلسه یک جمع بندی دقیق و آگاهی بخش برای جلسات طولانی ارائه کرده و یک ابزار اثربخش برای دسترسی کارآمد به اطلاعات به می باشد. در این مقاله ما روی استخراج خلاصه سازی تمرکز داریم که جملات برجسته از دستنوشته های جلسه انتخاب می شود تا یک جمع بندی به صورت تلخیص از آن استخراج شود. ما از روش یادگیری نظارتی برای این کار استفاده می کنیم و از دسته بندی برای مشخص کردن انتخاب جمله ای که در خلاصه مبتنی بر ویژگیهای داده ای غنی تر باشد بهره می گیریم. ما به دو مسئله مهم مرتبط با این روش دسته بندی نظارتی می پردازیم. اول ما روشهای نمونه گیری مختلف را پیشنهاد می کنیم که به مسئله داده های غیرمتعادل برای این کار می پردازند و در انها جملات خلاصه سازی گروه اقلیت را تشکیل می دهند. دوم، برای درنظرگرفتن عدم توافق انسانی برای خلاصه سازی، ما تکلیف خلاصه سازی استخراجی را با استفاده از ساختار رگرسیون به جای دسته بندی باینری یا دودویی، دوباره تعریف می کنیم. ما روشهای خودمان را با استفاده از مجموعه جلسات ICSI در مورد دستنوشته های انسانی و خروجی تشخیص سخنرانی ارزیابی می کنیم و بهبود عملکرد آنها را با استفاده از روشهای مختلف نمونه گیری و مدل رگرسیون نشان می دهیم.

چکیده لاتین

Meeting summarization provides a concise and informative summary for the lengthy meetings and is an effective tool for efficient information access. In this paper, we focus on extractive summarization, where salient sentences are selected from the meeting transcripts to form a summary. We adopt a supervised learning approach for this task and use a classifier to determine whether to select a sentence in the summary based on a rich set of features. We address two important problems associated with this supervised classification approach. First we propose different sampling methods to deal with the imbalanced data problem for this task where the summary sentences are the minority class. Second, in order to account for human disagreement for summary annotation, we reframe the extractive summarization task using a regression scheme instead of binary classification. We evaluate our approaches using the ICSI meeting corpus on both the human transcripts and speech recognition output, and show performance improvement using different sampling methods and regression model.

خرید و دانلود ترجمه این مقاله:

روی دکمه افزودن به سبد خرید کلیک کنید. مقاله به سبد خرید شما که در ستون سمت راست صفحه قرار دارد افزوده می شود. سپس روی دکمه اتمام خرید و پرداخت کلیک نمایید، پس از پرداخت بلافاصله به سایت بازگشته و می توانید فایل خود را دانلود کنید.

دیدگاهی بنویسید