идентификация пользователей социальных сетей в интернет на основе социальных связей

E-Book Overview

М.: Институт системного программирования РАН. – 18 с.
В настоящее время мы переживаем бум социальных интернет-сервисов. Каждый год появляется множество как общенаправленных, так и нишевых социальных сервисов, и для активных пользователей Интернет типично иметь несколько профилей в различных социальных сетях. Обнаружение профилей, принадлежащих одному человеку, в нескольких социальных сетях, позволяет получить более полный социальный граф, что может быть полезно во многих задачах, таких как информационный поиск, интернет-реклама, рекомендательные системы и т.д. В данной работе предлагается оригинальная JLA-модель идентификации пользователей, основанная на модели условных случайных полей и совместно использующая как атрибуты пользовательских профилей, так и социальные связи. Предложенный подход особенно полезен в случаях, когда информация о пользовательских профилях малополезна, недоступна или скрыта из соображений приватности. Эксперименты на данных из двух популярных в настоящий момент социальных сетей Facebook и Twitter показали, что данный подход работает эффективнее существующих решений и способен сопоставить профили, которые невозможно сопоставить, используя только информацию об атрибутах.

E-Book Content

Èäåíòèôèêàöèÿ ïîëüçîâàòåëåé ñîöèàëüíûõ ñåòåé â Èíòåðíåò íà îñíîâå ñîöèàëüíûõ ñâÿçåé Ñåðãåé Áàðòóíîâ ∗ Àíòîí Êîðøóíîâ † Àííîòàöèÿ  íàñòîÿùåå âðåìÿ ìû ïåðåæèâàåì áóì ñîöèàëüíûõ èíòåðíåòñåðâèñîâ. Êàæäûé ãîä ïîÿâëÿåòñÿ ìíîæåñòâî êàê îáùåíàïðàâëåííûõ, òàê è íèøåâûõ ñîöèàëüíûõ ñåðâèñîâ, è äëÿ àêòèâíûõ ïîëüçîâàòåëåé Èíòåðíåò òèïè÷íî èìåòü íåñêîëüêî ïðîôèëåé â ðàçëè÷íûõ ñîöèàëüíûõ ñåòÿõ. Îáíàðóæåíèå ïðîôèëåé, ïðèíàäëåæàùèõ îäíîìó ÷åëîâåêó, â íåñêîëüêèõ ñîöèàëüíûõ ñåòÿõ, ïîçâîëÿåò ïîëó÷èòü áîëåå ïîëíûé ñîöèàëüíûé ãðàô, ÷òî ìîæåò áûòü ïîëåçíî âî ìíîãèõ çàäà÷àõ, òàêèõ êàê èíôîðìàöèîííûé ïîèñê, èíòåðíåò-ðåêëàìà, ðåêîìåíäàòåëüíûå ñèñòåìû è ò.ä.  äàííîé ðàáîòå ïðåäëàãàåòñÿ îðèãèíàëüíàÿ ¾JLA-ìîäåëü¿ èäåíòèôèêàöèè ïîëüçîâàòåëåé, îñíîâàííàÿ íà ìîäåëè óñëîâíûõ ñëó÷àéíûõ ïîëåé è ñîâìåñòíî èñïîëüçóþùàÿ êàê àòòðèáóòû ïîëüçîâàòåëüñêèõ ïðîôèëåé, òàê è ñîöèàëüíûå ñâÿçè. Ïðåäëîæåííûé ïîäõîä îñîáåííî ïîëåçåí â ñëó÷àÿõ, êîãäà èíôîðìàöèÿ î ïîëüçîâàòåëüñêèõ ïðîôèëÿõ ìàëîïîëåçíà, íåäîñòóïíà èëè ñêðûòà èç ñîîáðàæåíèé ïðèâàòíîñòè. Ýêñïåðèìåíòû íà äàííûõ èç äâóõ ïîïóëÿðíûõ â íàñòîÿùèé ìîìåíò ñîöèàëüíûõ ñåòåé ¾Facebook¿ è ¾Twitter¿ ïîêàçàëè, ÷òî äàííûé ïîäõîä ðàáîòàåò ýôôåêòèâíåå ñóùåñòâóþùèõ ðåøåíèé è ñïîñîáåí ñîïîñòàâèòü ïðîôèëè, êîòîðûå íåâîçìîæíî ñîïîñòàâèòü, èñïîëüçóÿ òîëüêî èíôîðìàöèþ îá àòòðèáóòàõ. ∗ [email protected], Èíñòèòóò ñèñòåìíîãî ïðîãðàììèðîâàíèÿ Ðîññèéñêîé àêàäåìèè íàóê, Ðîññèÿ, 109004, ã. Ìîñêâà, óë. À. Ñîëæåíèöûíà, äîì 25. † [email protected], Èíñòèòóò ñèñòåìíîãî ïðîãðàììèðîâàíèÿ Ðîññèéñêîé àêàäåìèè íàóê, Ðîññèÿ, 109004, ã. Ìîñêâà, óë. À. Ñîëæåíèöûíà, äîì 25. 1 2 Èäåíòèôèêàöèÿ ïîëüçîâàòåëåé ñîöèàëüíûõ ñåòåé â Èíòåðíåò Êëþ÷åâûå ñëîâà: èäåíòèôèêàöèÿ ïîëüçîâàòåëåé, àíàëèç ñîöè- àëüíûõ ñåòåé, óñëîâíûå ñëó÷àéíûå ïîëÿ, ãðàôè÷åñêèå ìîäåëè, îáðàáîòêà ãðàôîâ, ìàøèííîå îáó÷åíèå Ââåäåíèå Åùå íåñêîëüêî ëåò íàçàä áûëî òðóäíî ïðåäïîëîæèòü, êàêèì îãðîìíûì áóäåò ïðèñóòñòâèå ñîöèàëüíûõ ïðèëîæåíèé â íàøåé æèçíè. Òåì íå ìåíåå, ñåé÷àñ ìû æèâåì â ýïîõó îíëàéíîâûõ ñîöèàëüíûõ ñåòåé. Ââèäó áåñïðåöåäåíòíîãî ìàñøòàáà ñîöèàëüíûõ ñåðâèñîâ è, êàê ñëåäñòâèå, áîëüøîãî êîëè÷åñòâà èíôîðìàöèè, çàêëþ÷åííîé â íèõ, ïðèâëå÷åíèå ñîöèàëüíîé ñîñòàâëÿþùåé ïðè ðåøåíèè ìíîãèõ çàäà÷ ìîæåò çíà÷èòåëüíî óëó÷øèòü ðåçóëüòàòû. Îñíîâíîé ïðîáëåìîé ïðè çàäåéñòâîâàíèè ñîöèàëüíîé èíôîðìàöèè ÿâëÿåòñÿ å¼ ôðàãìåíòè
You might also like

The Ama Handbook Of Project Management
Authors: Paul C. Dinsmore PMP    151    0


Marketing Management: Millennium Edition
Authors: Philip Kotler    172    0


Strategic Management: Process, Content, And Implementation
Authors: Hugh Macmillan , Mahen Tampoe    163    0


Business Vocabulary In Use
Authors: Bill Mascull    143    0


Form And Pattern As A Trading Tool
Authors: Miner R.    100    0


Practical Elliott Wave Trading Strategies
Authors: Miner R.    184    0




The Project Management Communications Toolkit
Authors: Carl Pritchard    204    0