Уявіть, що ви слідчий. Або, можливо, компульсивний сталкер. Або, можливо, просто рекламодавцем. Ви хочете з'ясувати деякі особисті якості людини з… причин. Отже, ви входите у Facebook, шукаєте їх і скануєте їх профіль.
Але не пощастило. Вони поклали кожну важливу інформацію за стіну конфіденційності. У простому і нудному світі на цьому історія має закінчитися.
Але наш світ інтриг і див, і ви не з тих, хто легко здається. Таким чином, ви ще трохи копаєтеся в профілі користувача і насправді встигаєте ознайомитися з деякими особистими інтересами, які вони відкрито розкрили у Facebook.
Якби ви мали дедуктивні здібності Шерлока Холмса, можливо, було б достатньо, щоб з’ясувати все, що вам потрібно знати про цю людину, виходячи лише з її інтересів.
Хоча тут ніхто з нас не є Шерлоком, штучний інтелект є розумним наближенням до талантів великого детектива.
Це насправді вдалося зробити дослідникам за допомогою алгоритму NLP (Natural Language Processing): вони передбачили приховані особистісні атрибути користувачів Facebook, використовуючи лише їхні публічно розкриті інтереси.
Зокрема, дослідники змогли передбачити такі особистісні характеристики користувачів, виходячи виключно з їхніх музичних інтересів:
- Вік
- Розташування
- Стать
- Сімейний стан
Хоча стаття, в якій дослідники опублікували свої висновки, зараз трохи застаріла (опублікована в 2012 році), вона служить чудовою демонстрацією того, як приватна інформація може просочуватися через соціальні мережі, навіть якщо ви зробили майже всі дані про себе невидимими для сторонніми особами.
ти те, що тобі подобається
Налаштування конфіденційності на веб-сайтах соціальних мереж сьогодні дають користувачам набагато більший контроль над видимістю їхньої інформації (зрештою, незліченні порушення конфіденційності в соціальних мережах мали певну користь).
Але чи справді цього достатньо, щоб запобігти розкриттю вашої прихованої інформації? На жаль, дослідження вчених з INRIA Франції доводять протилежне.
Дослідники показали, що, використовуючи музичні вподобання та інтереси користувача, розкриті у Facebook, можна передбачити його вік, стать, статус стосунків і місце розташування.
Оскільки інтереси, уподобання та антипатії більшості користувачів є загальнодоступними, потенційному сталкеру не потрібно надто старатися, щоб побачити, що подобається більшості користувачів у Facebook. Звідси, це питання статистичної кореляції та ймовірності, щоб з’ясувати ваші особистісні атрибути, як-от статус стосунків і місце розташування.
Отже, як саме програма ШІ з’ясовує особисті дані про вас на спрощеній основі того, що вам подобається?
Від музичного смаку до особистих деталей
Припустимо, що прихованим особистим атрибутом у вашому профілі Facebook є ваш вік (це ми хочемо зробити висновок) і вам сподобалася офіційна сторінка Metallica (яку ви вирішили оприлюднити). Далі припустимо для простоти, що є 5 інших публічних профілів у Facebook, зацікавлених у Metallica, які також відкрито розкрили свій вік для всіх. Якщо 4 з 5 з них належать до вікової групи 18-24, то за голосуванням більшості ваш прихований атрибут (у даному випадку ваш вік) також, ймовірно, буде 18-24.
(Цей приклад використовується лише в ілюстративних цілях і не обов'язково відповідає дійсності)
Хоча підхід здається занадто простим, щоб бути ефективним, дослідники отримали точність висновку 72,5% для деяких атрибутів користувача. Це було досягнуто за допомогою єдиного прогнозного фактора музичного інтересу з набагато більшого пулу загальнодоступних особистих інтересів. Більш складні моделі, здатні враховувати інтереси кількох користувачів, не тільки зможуть визначити більший діапазон особистих атрибутів, але й зроблять це з ще кращою точністю.
І це є приводом для занепокоєння, тому що чутливі до конфіденційності атрибути користувачів у соціальних мережах, навіть якщо вони приховані, не є такими безпечними, як прийнято вважати.
Дилема згоди
Найпотужнішою характеристикою цього методу прогнозування особистих властивостей є те, що він покладається виключно на саморозкриту інформацію користувачів Facebook про музичні інтереси,
У цьому підході немає абсолютно нічого хитромудрого, як-от використання шкідливого програмного забезпечення або вимушеного злому інформації. Ця техніка просто максимально використовує те, що доступне в Інтернеті, а інформація про наші інтереси просто є чимось широко доступною в епоху соціальних мереж.
Це робить цю техніку надзвичайно складною для вирішення будь-якого законодавства про захист конфіденційності, тим більше, що згода користувача неявно міститься в інформації, яка є загальнодоступною. Закон може захистити нашу конфіденційність, якщо є докази порушення або зловживання інформацією користувача, наприклад, коли треті сторони отримують доступ до вашої особистої інформації.
У даному випадку ця методика спирається виключно на складні здогади, які повністю забезпечуються загальнодоступною інформацією користувача, яка несе з собою неявну згоду на публічний доступ.
Проти цього будь-який юридичний захист мені здається немислимою. Ви б попросили заборонити практику вгадування, щоб подати до суду на кого-небудь за точне передбачення вашого статусу стосунків на основі ваших музичних уподобань, які ви з радістю розкрили з власної волі.
Тим не менш, модель дослідника може бути використана для цілей, більш підступних і юридично обґрунтованих, ніж прості ігри вгадування.
Підготовка до надзвичайної ситуації щодо конфіденційності
Деякі з можливих зловживань методикою дослідників включають доксування. Завдяки можливості збирати персональні дані користувача на основі їхніх інтересів, доксінг стане легшим для зловмисників, залишаючи більшу кількість користувачів уразливими до потенційних витоків інформації та доступу до Інтернету.
Спамери також можуть мати можливість зіставити профіль користувача у Facebook із його адресою електронної пошти та розсилати спамерську скриньку за допомогою цільової реклами, створеної відповідно до прогнозованих інтересів користувача.
Для рекламодавців ці методи прогнозування можуть бути саме тим, що їм потрібно для ефективного профілювання користувачів для націлювання реклами, в той час як прогнози окремих атрибутів на основі інтересів можуть стати важливим компонентом майбутніх технологій, а файли cookie браузера знаходяться на межі зникнення.
Як би ви не подивилися на це, саме користувач отримує короткий кінець палиці, оскільки наша конфіденційність зводиться до вільно звисає нитки, яка здуває в будь-якому напрямку, куди його несе вітер.
І тому, якраз тоді, коли ви думали, що вам важко зберегти деяку схожість конфіденційності, наші передові технологічні можливості завдають ще одного удару, щоб ми залишалися голими в Інтернеті.
Ми все ближче наближаємося до ситуації, коли єдиним шляхом вперед може бути визнання світу, позбавленого цифрової конфіденційності; право, яке ми продали, щоб прогодувати нашу власну технофілію, що зростає. Конфіденційність цілком може бути необхідною жертвою для подальшого технологічного прогресу, але наскільки ми готові зробити крок у світ, де тіні існують лише для захисту агресора, а інвазивні прожектори залишаються приклеєними до агресора?