پیش بینی آمارگیری های مردمی کاربر توئیتر با استفاده از نظارت از راه دور روی داده ترافیک وب سایت
Predicting Twitter User Demographics using Distant Supervision from Website Traffic Data
مشخصات کلی
سال انتشار | 2016 |
کد مقاله | 3800 |
فرمت فایل ترجمه | Word |
تعداد صفحات ترجمه | 21 |
نام مجله | Journal of Articial Intelligence Research |
نشریه | فاقد منبع |
درج جداول و شکل ها در ترجمه | انجام شده است |
جداول داخل مقاله | ترجمه نشده است |
چکیده فارسی
درک جامعه شناسی کاربران شبکه های اجتماعی آنلاین کاربردهای مهمی برای سلامتی ، بازاریابی و پیغام دادن عمومی دارد.نظر به اینکه اغلب رویکردهای برتر ، متکی به یک رویکرد یادگیری نظارت شده هستند که در آن کاربران منحصر به فرد با آمارگیری های مردمی برای یادگیری برچسب گذاری شده اند – ما در عوض یک مجموعه داده از راه دور برچسب گذاری شده را با جمع آوری داده اندازه گیری حضار برای 1500 وب سایت ، ایجاد می کنیم (مثلا 50% از بازدیدکنندگان از gizmodo.com تخمین زده شده اند که یک درجه تجربه دارند).سپس ما یک مدل رگرسیون برای پیش بینی این آمارگیری های مردمی ها از اطلاعات درباره فالوورهای هر وب سایت روی توئیتر را پیش بینی می کنیم.با استفاده از الگوهای استخراج شده هم از محتوای متنی و هم از شبکه اجتماعی هر کاربر ، مدل نهایی ما یک همبستگی میانگین 0.77 را در سراسر هفت متغیر مختلف (سن ، جنسیت ، تحصیلات ، وضع مالی ، درآمد ، وضعیت والد و جهت گیری سیاسی ) تولید می کند.سپس این مدل را برای طبقه بندی کاربران توئیتر منحصر به فرد توسط وضع مالی ، جنسیت و جهت گیری سیاسی اعمال می کنیم و عملکردی که به طور شگفت آوری با یک رویکرد کاملا نظارت شده رقابت می کند را می یابیم.
چکیده لاتین
Understanding the demographics of users of online social networks has important ap- plications for health, marketing, and public messaging. Whereas most prior approaches rely on a supervised learning approach, in which individual users are labeled with demo- graphics for training, we instead create a distantly labeled dataset by collecting audience measurement data for 1,500 websites (e.g., 50% of visitors to gizmodo.com are estimated to have a bachelor's degree). We then t a regression model to predict these demographics from information about the followers of each website on Twitter. Using patterns derived both from textual content and the social network of each user, our nal model produces an average held-out correlation of .77 across seven dierent variables (age, gender, education, ethnicity, income, parental status, and political preference). We then apply this model to classify individual Twitter users by ethnicity, gender, and political preference, nding performance that is surprisingly competitive with a fully supervised approach.
خرید و دانلود ترجمه این مقاله:
جهت خرید این مقاله ابتدا روی لینک زیر کلیک کنید، به صفحه ای وارد می شوید که باید نام و ایمیل خود را وارد کنید و پس از آن روی دکمه خرید و پرداخت کلیک نمایید، پس از پرداخت بلافاصله به سایت بازگشته و می توانید فایل خود را دانلود کنید، همچنین لینک دانلود به ایمیل شما نیز ارسال خواهد شد.
هیچ دیدگاهی برای این مقاله ثبت نشده است
دیدگاه ها