مقالات ترجمه شده

ماشین های بردار پشتیبان و Word2vec برای دسته بندی متن با ویژگی های معنا شناختی

عنوان فارسی

ماشین های بردار پشتیبان و Word2vec برای دسته بندی متن با ویژگی های معنا شناختی


عنوان لاتین

Support Vector Machines and Word2vec for Text Classification with Semantic Features

مشخصات کلی

سال انتشار 2015
کد مقاله 3959
فرمت فایل ترجمه Word
تعداد صفحات ترجمه 7
نام مجله فاقد منبع
نشریه IEEE
درج جداول و شکل ها در ترجمه انجام نشده است
جداول داخل مقاله ترجمه نشده است

چکیده فارسی

با گسترش سریع اطلاعات جدید در دسترسی که بصورت روزانه به ما ارائه می شوند، دسته بندی متن به منظور دسته بندی و حفظ آن ها، تبدیل به یک امر ضروری شده است. Word2vec یک دیدگاه منحصربفرد برای جامعه ی داده کاوی متن ارائه می دهد. با تبدیل لغات و عبارات به یک نمایش برداری، Word2vec یک رویکرد کاملا جدید در رابطه با دسته بندی متن در پیش گرفته است. براساس این فرضیه که Word2vec ویژگی های معنا شناختی بیش تری اضافه می کند که به دسته بندی متن کمک می کند، مقاله ی ما کارایی Word2vec را با نمایش این که ترکیب tf-idf و Word2vec می تواند بر tif-idf غلبه کند، نشان می دهد، زیرا Word2vec ویژگی های مکملی برای tf-idf ارائه می دهد. نتایج ما نشان می دهند که ترکیب Word2vec وزنی با tf-idf و tf-idf بطور پیوسته بر tf-idf برتری ندارد. اما به اندازه ی کافی برای گفتن این که ترکیب این دو می تواند به تک تک آن ها غلبه کند، پیوسته می باشد.

چکیده لاتین

With the rapid expansion of new available information presented to us online on a daily basis, text classification becomes imperative in order to classify and maintain it. Word2vec offers a unique perspective to the text mining community. By converting words and phrases into a vector representation, word2vec takes an entirely new approach on text classification. Based on the assumption that word2vec brings extra semantic features that helps in text classification, our work demonstrates the effectiveness of word2vec by showing that tf-idf and word2vec combined can outperform tf-idf because word2vec provides complementary features (e.g. semantics that tf-idf can't capture) to tf-idf. Our results show that the combination of word2vec weighted by tf-idf and tf-idf does not outperform tf-idf consistently. It is consistent enough to say the combination of the two can outperform either individually.

خرید و دانلود ترجمه این مقاله:

جهت خرید این مقاله ابتدا روی لینک زیر کلیک کنید، به صفحه ای وارد می شوید که باید نام و ایمیل خود را وارد کنید و پس از آن روی دکمه خرید و پرداخت کلیک نمایید، پس از پرداخت بلافاصله به سایت بازگشته و می توانید فایل خود را دانلود کنید، همچنین لینک دانلود به ایمیل شما نیز ارسال خواهد شد.

دیدگاه ها

هیچ دیدگاهی برای این مقاله ثبت نشده است

ارسال دیدگاه

مقالات معتبر علمی از ژورنال های ISI