بهبود یادگیری نظارتی برای خلاصه سازی جلسه با استفاده از نمونه گیری و رگرسیون
Improving supervised learning for meeting summarization using sampling and regression
مشخصات کلی
سال انتشار | 2010 |
کد مقاله | 1606 |
فرمت فایل ترجمه | Word |
تعداد صفحات ترجمه | 27 |
نام مجله | Computer Speech and Language |
نشریه | ScienceDirect |
درج جداول و شکل ها در ترجمه | انجام شده است |
جداول داخل مقاله | ترجمه شده است |
چکیده فارسی
خلاصه سازی جلسه یک جمع بندی دقیق و آگاهی بخش برای جلسات طولانی ارائه کرده و یک ابزار اثربخش برای دسترسی کارآمد به اطلاعات به می باشد. در این مقاله ما روی استخراج خلاصه سازی تمرکز داریم که جملات برجسته از دست نوشته های جلسه انتخاب می شود تا یک جمع بندی به صورت تلخیص از آن استخراج شود. ما از روش یادگیری نظارتی برای این کار استفاده می کنیم و از دسته بندی برای مشخص کردن انتخاب جمله ای که در خلاصه مبتنی بر ویژگیهای داده ای غنی تر باشد بهره می گیریم. ما به دو مسئله مهم مرتبط با این روش دسته بندی نظارتی می پردازیم. اول ما روشهای نمونه گیری مختلف را پیشنهاد می کنیم که به مسئله داده های غیرمتعادل برای این کار می پردازند و در انها جملات خلاصه سازی گروه اقلیت را تشکیل می دهند. دوم، برای درنظر گرفتن عدم توافق انسانی برای خلاصه سازی، ما تکلیف خلاصه سازی استخراجی را با استفاده از ساختار رگرسیون به جای دسته بندی باینری یا دودویی، دوباره تعریف می کنیم. ما روشهای خودمان را با استفاده از مجموعه جلسات ICSI در مورد دستنوشته های انسانی و خروجی تشخیص سخنرانی ارزیابی می کنیم و بهبود عملکرد آنها را با استفاده از روشهای مختلف نمونه گیری و مدل رگرسیون نشان می دهیم
چکیده لاتین
Meeting summarization provides a concise and informative summary for the lengthy meetings and is an effective tool for efficient information access. In this paper, we focus on extractive summarization, where salient sentences are selected from the meeting transcripts to form a summary. We adopt a supervised learning approach for this task and use a classifier to determine whether to select a sentence in the summary based on a rich set of features. We address two important problems associated with this supervised classification approach. First we propose different sampling methods to deal with the imbalanced data problem for this task where the summary sentences are the minority class. Second, in order to account for human disagreement for summary annotation, we reframe the extractive summarization task using a regression scheme instead of binary classification. We evaluate our approaches using the ICSI meeting corpus on both the human transcripts and speech recognition output, and show performance improvement using different sampling methods and regression model
خرید و دانلود ترجمه این مقاله:
جهت خرید این مقاله ابتدا روی لینک زیر کلیک کنید، به صفحه ای وارد می شوید که باید نام و ایمیل خود را وارد کنید و پس از آن روی دکمه خرید و پرداخت کلیک نمایید، پس از پرداخت بلافاصله به سایت بازگشته و می توانید فایل خود را دانلود کنید، همچنین لینک دانلود به ایمیل شما نیز ارسال خواهد شد.
هیچ دیدگاهی برای این مقاله ثبت نشده است
دیدگاه ها