libre.UA ВІКІ

🌐🔒️Вільне програмне забезпечення

Головна сторінка Ресурси Новини Спільноти

Автори: eldritchdata, just_bird та ChatGPT (переклад)

Стилометрія

Передмова

Перш ніж стилометрія була зброєю в руках розвідок, вона мала практичне застосування в аналізі текстів на достовірність, виявленні авторства та ідентифікації особи серед інших речей. Основи цієї науки були закладені Вінцентим Лютославським, польським філософом, який відомий своєю методикою побудови хронології діалогів Платона. Вінценти, ймовірно, не міг уявити, що стилометрія піде так далеко, особливо з розвитком комп'ютерів і їхнього практично необмеженого потенціалу щодо аналізу великих обсягів даних.

Комп'ютери, з їхнім відмінним потенціалом для аналізу, змінили парадигму профілювання особи та збирання інформації про неї. Це означає, що в будь-який момент часу все, що ви говорите чи робите в Інтернеті, з великою ймовірністю буде каталогізовано на якомусь чорному сервері у тихому кабінеті вашого постачальника Інтернету або в центрі обробки даних в Юти, де уряд може переглядати їх на свій розсуд. Ви просто стаєте ще одним фрагментом даних, який потрапляє у досьє та класифікується урядом разом із багатьма іншими.

Це не означає, що вам слід відмовитися від надії на будь-яку форму приватності, але ви повинні бути усвідомлені, що ви можливо розкриваєте у мережі. Цей розділ допоможе вам усунути один зі способів ідентифікації особи, який часто використовується. Тому, будь ласка, відводьте час і уважно ознайомтесь з цим.

Чому варто бути занепокоєним.

Все, що ми говоримо і робимо, має власний стиль, незалежно від того, що це і як ми це робимо. У кожного є свій власний стиль, який проявляється у всьому, що вони роблять, не лише в прозі та мистецтві. Навіть кодування може розкривати, хто, що і коли робив, особливо коли видаляються символи відладки та використовуються звичайні техніки обфускації бінарних даних. Анонімність неможлива навіть у випадку, якщо ви вживаєте всі звичайні заходи, якщо ви не працюєте над зниженням своїх стилометричних оцінок. Художні досягнення, кодування, письмо і навіть мова можуть розповісти багато про людину, особливо про тих, хто має досвід у своїй обраній професії або хобі. Кожен формує свій власний стиль у житті щодо різних речей, тому не дивно, що чим більше досвіду має людина, тим легше відрізнити її від інших. Через це все, що зустрічається на шляху, може бути використано будь-ким для вивчення того, хто його створив. Ми можемо дізнатися індивідуальний стилістичний відбиток від таких речей, як спосіб використання слова або розділового знака, до таких речей, як мазки пензлем чи використання тінювання. Це може бути використано, коли є група кандидатів, і за допомогою якогось достойного розслідування ми можемо визначити, хто створив те, що ми розглядаємо.

Також існують програми, які допомагають у цьому підприємстві, і уряд - не єдиний, хто має до них доступ. Якщо ви знаєте, куди дивитися, і маєте деякі гроші на розсуд, ви можете отримати доступ до програм, які можуть визначати автора предмета з жахливою точністю понад 90%. Це лише утверджується, коли в Інтернеті доступно більше інформації, готової для вільного доступу. Публічна доступність і знайомство є ворогом приватності та анонімності. Ми повинні навчитися обмежувати себе і контролювати наші імпульси, щоб подальше запобігти витоку інформації. Один зі способів зробити це - розширювати власні знання про будь-яку обрану тему чи дію, в якій ми беремо участь.

Основи

Маскування способу вашого набору тексту.

Тепер основне тут - це дізнатися про свій власний стиль письма та його ключові характеристики, які ідентифікують вас. Зазвичай це робиться шляхом порівняння частоти вживання слів, розділових знаків та ідентифікаторів, жаргону, висловів... і т. д. Це порівнюється з базою даних, тобто вашими постами та різними діями в Інтернеті, які приписуються вам та лише вам. Тож, виходячи з цієї інформації, ми мусимо припустити, що існують кроки, які слід вжити для очищення нашої прози. Найбільш корисна форма очищення - це просте володіння англійською мовою. Це означає знання правильної орфографії та граматики, уникання регіон-специфічного написання, серед іншого, таких як перевикористання жаргону, мемів та скорочень, мова чату... і т. д. Це спільно з вищезазначеним, сподіваємося, допоможе вам та багатьом іншим у запобіганні стилометрії.

Catting (або кіт-копіювальник) Хоча багато хто буде обурені тим, що ми згадуємо цю тактику, вона є одним із найпоширеніших способів злиття або маскування вашого власного лінгвістичного відбитку. Вона сильно ґрунтується на знанні основ англійської мови та вашій здатності впізнавати патерни. Це набагато простіше, ніж здається, однак ми закликаємо вас ніколи не використовувати цю тактику, крім особистої практики. Спочатку ви починаєте, отримавши 10-20 зразків публікацій особи в Інтернеті, зазвичай різноманітних, від найдавнішого можливого до різних прикладів до останніх. Звідти ви читаєте і вивчаєте текст, який ви здобули від вашої цілі. Тепер, коли ви прочитали його кілька разів і робили помітки про те, як вони використовують пунктуацію, великі літери, а також будь-який жаргон або загальні слова (для них)... ви можете додавати і віднімати, поки у вас не буде абзац, що звучить точно так, як щось, що вони сказали б чи зробили. Як тільки ви повторите це кілька разів, спробуйте зробити щось самостійно і подивіться, чи підходить воно. Як тільки ви зробите це правильно, ви можете перейти до тактик нижче, але ми повинні закликати вас ніколи не використовувати цю тактику у публічних місцях або використовувати її як вашу основну опцію, оскільки це ставить інших людей і їх інформацію під загрозу. Ми не хочемо потрапляти інших у небезпеку, ми просто використовуємо цю тактику (особисто / ніколи не публікуємо в Інтернеті), щоб ознайомитися з тим, як інші копіюють та використовують стилі публікацій інших. Це також дозволяє нам звикнути до модифікації нашої власної прози.
Вибіркове дослідження Подібно до котячого (catting), зразкивання (sampling) вимагає вибору 5-10 цілей замість одного і використання їх зразків для побудови цілковито нового стилю письма. Це досить просто і ґрунтується на тому, що ви слідуєте тому ж процесу, що і при котячому. Після завершення одного зразка ви ставите його в сторону і повторюєте процес, поки всі ваші зразки не будуть готові. Як тільки всі ваші зразки готові, ви починаєте розбирати їх і знову складати, щоб створити новий стиль письма. Цей стиль настільки віддалений від вашого початкового зразка, що його не буде можливо відслідкувати назад до кого-небудь, і це гарантує вам зовсім новий і напів-оригінальний стиль письма, який можна використовувати під час вашої діяльності в Інтернеті.
Слав Кінг Це подібно до того, що запропонували Рао та Рохатгі в 2000 році, так званий "повний обхід машинного перекладу". Вибираючи основи англійської мови, ви складаєте те, що хочете сказати, а потім використовуєте сервіс, такий як Google Translate, щоб перекласти це на іншу мову. Після цього ви перекладаєте його ще раз на іншу мову і знову на англійську. З незначними "виправленнями" ви зможете створити стиль публікації, який читається так, ніби його написав носій неанглійської мови.
Вікові групи Шляхом перегляду профілів для конкретної вікової групи та вправляннямся в зразкуванні, людина може не лише притворюватися іншої статі, але й іншого віку. Це популярна техніка, яку використовують сексуальні хижаки для завоювання довіри та отримання додаткової інформації про ціль, однак, якщо використовується правильно, людина може використовувати цю техніку, щоб ще більше приховати свою ідентичність і запобігти вгадуванню інформації правильно.
Заміна Ця тактика зазвичай називається "тролінговою тактикою", але насправді вона досить корисна, коли мова йде про маскування способу вашого набору тексту. Найпростіше пояснення того, що потрібно зробити, таке: ви знаходите форум, чат або сайт для підкультури або хобі та просто приховуєтеся чи "заходите" (наприклад, реєструєтесь і лише читаєте/слухаєте, що говорять). Ви отримуєте базове розуміння жаргону та культурних висловів до такого ступеня, що "вписуєтеся" та можете це робити, не викликаючи підозр. Потім ви використовуєте те, що вивчили, просто створюючи новий стиль набору тексту (схожий на той, що у основної групи підкультури або хобі), який можна використовувати в інших місцях. Це трохи нагадує те, як люди використовують жаргон та загальні вислови, щоб позначити, до якої групи/фендому вони належать, наприклад, любителі потягів або панки. Ви можете приховати себе та спосіб вашого набору тексту, просто наслідуючи та позичаючись у різних груп.
Секта Просто кажучи, група людей, зазвичай більша, ніж два особи, використовує одну або кілька з вищезазначених тактик, щоб сформувати власний стиль набору тексту. Після цього вони працюють над поєднанням цих стилів, щоб сформувати один стиль набору тексту, за яким всі вони потім слідують. Ця тактика була позичена від китайських активістів, які постійно борються проти корупції в своїй державі. У зв'язку з тим, як Китай став анти-приватністю, активісти розробили цю тактику, щоб приховати, скільки людей входить до групи, яка публікується в Інтернеті, особливо якщо це просто одна особа, яка намагається створити підступ, щоб заплутати кожного, хто намагається їх відстежити. Однією із варіацій цієї тактики, яку ми висвітлимо, є те, що кожен домовляється про копіювання (котячення) особи з групи і публікує в такому стилі все, що стосується цієї групи або її діяльності.

Замітка:Будьте уважні до регіональних та культурних відмінностей. Це включає, але не обмежується правописом, жаргоном, висловами та подібними елементами. Спробуйте свідомо розпізнавати ці ознаки не лише у ваших власних вчинках чи словах, але й у тому, що роблять чи кажуть інші. Це може допомогти вам розширити вашу приватність та безпеку, а також зрозуміти, наскільки багато ми, сами, можемо втратити у мережі Інтернет.

Поєднуючи те, що ви вивчили.

Тепер перше, що ми повинні зробити, це провести власний аналіз стилометрії щодо самих себе. Це можна зробити або за допомогою вашого улюбленого текстового процесора, або через Anonymouth. Ми розглянемо основи нижче про те, як ви можете провести "грубу" версію стилометрії. Ми рекомендуємо зробити це як через текстовий процесор, так і через Anonymouth, щоб мати повну картину. Перш ніж продовжувати, перевірте це посилання, оскільки воно є обов'язковим для прочитання, щоб зрозуміти основи.http://peterkirby.com/basic-stylometry-101.html

Основи стилометрії в кількох словах: аналіз тексту для визначення авторства на основі використання лексики, структури речень, виразів тощо.

Тепер, коли ви отримали загальне уявлення про те, як виявляти до певної міри власні ідентифіковані маркери, настав час перевірити Anonymouth. Матеріали для читання, що йдуть разом з ним, повинні бути достатніми, щоб пояснити, як його налаштувати і як користуватися ним. Як тільки ви зрозумієте це, скористайтеся ним разом з вищезазначеними основами. Це буде додатковим кроком, але це допоможе вам у майбутньому.

тезауритизм Відвідайтеhttps://www.thesaurus.com/Або самостійно розвивайте свої навички та шукайте синонім для вживаного слова. Так, замість слова "вбивство", ви можете сказати "анігілювали" (Приклад: Замість "Комуністи вбили багатих" ви можете сказати, що вони "анігілювали багатих"). Заміна слів таким чином може допомогти створити ілюзію псевдоінтелектуальності або навіть справжнього інтелекту. Все залежить від того, як ви це реалізуєте. Розважайтеся, розвивайтесь. Ви можете створити цілу низку нових маркерів/ознак/ідентифікаторів, які збентежать будь-якого шпигуна ЦРУ чи урядового темного підрозділу.
Регіональна ілюзія Ця тактика потребує трохи часу і досліджень, і зазвичай супроводжується створенням текстового файлу з інформацією, але вона корисна, якщо ви хочете збити людей з пантелику щодо вашого місцезнаходження або намагаєтеся з'явитися звідкись іншого. Наприклад, текстовий файл може містити наступне: (слово) + (Регіон) = (Опис використання). Маючи це під рукою, ви зможете додати один або декілька елементів, щоб порушити регіональні асоціації або уперті припущення щодо місця знаходження. Нижче наведено кілька посилань, щоб допомогти вам розпочати...
Пішов Ти Буквально просто додавання ненормативної лексики в мікс. Вірте чи ні, кілька людей було піймано АБВ через їхній брудний рот. Тепер це треба мати на увазі.
Королівська Англійська Залежно від того, звідки ви, або з ким ви спілкуєтеся, ви можете помітити, як певні області в англійській мові використовують різні написання слів. Пам'ятайте про це, особливо якщо ви намагаєтеся змішати людей щодо континенту вашого походження.
Залишання слідів Мета цього підсилювача - віддавати (хибні) особисті дані так, ніби ви навіть не знаєте про це, або занадто звикли до цього, що є великою помилкою, якщо ви намагаєтеся зберегти приватність. Наприклад: "ОМГ! Я не можу зараз!!1 Вже 1 ранку! 0.0". Зверніть увагу на використання часу і деяких підсилювачів, таких як смайлики і мова чату. Щось подібне до вищезазначеного, у вільній природі, буде приписано або недорослій особі, яка молода або жінка (або частині певних підкультур).
Згадування того чго не було Кожен має минуле, яке вони хотіли б забути, або знають когось, хто має таке минуле, коли мова йде про аніме та стереотипну поведінку фанів, наприклад, надмірне використання смайликів. Вийміть це заборонене знання з сейфу, бо воно може бути корисним для полиття червоних гарібів. Чи то як заміна реального пунктуаційного знака, чи просто кидання його в середині речення або в кінці, вони допомагають виразити те, що ви маєте на увазі, і приховати ваш вік та стать. Перевірте нижченаведені посилання для деяких прикладів, які ви можете зберегти в текстовий файл і використовувати, якщо знадобиться.
Оригінал невідомий Ще один непоганий підсилювач - заміна англійського еквіваленту слова схожим словом з іншої мови. Найпоширеніші приклади - використання японських або іспанських слів замість англійських. Зберігайте все простим і використовуйте лише кілька одночасно. Ви можете заплутати багатьох, якщо використовуватимете приказки або вислови з іншої мови, щоб спробувати виразити щось інше, наприклад, порівняти ситуації (Подумайте про псевдо-інтелектуала, який постійно цитував китайські приказки після подорожі туди).

Виберіть свою тактику (тактики). Одна - добре, дві - краще, три або більше - найкраще. Основний шаблон зазвичай складається з трьох або чотирьох тактик. Щось на зразок Копіювання - Вибірковий аналіз - (Третя тактика) - Слав Кінг. Після цього, перевірте свій новий зразок за допомогою основних принципів + Anonymouth, і ви отримаєте абсолютно унікальний та зовсім новий стиль публікації в Інтернеті. Зберігайте кілька зразків, щоб постійно перевіряти їх проти вашого звичайного стилю + будь-яких нових, які ви створюєте, щоб запобігти будь-якому перехресному забрудненню або зворотній перевірці.

Тепер поєднайте все це і створіть ваш новий стиль публікації (стилі). Власне, це все. Це займе багато часу і потребує трохи практики, але це варто того, коли ви розумієте, наскільки важко для когось, особливо для блима в темряві, відстежити вас через текст. Пам'ятайте, що стилометрист, якого використовує уряд, матиме більше інструментів та іграшок, ніж ми або більшість людей. Працюючи над приховуванням наших маркерів/підказок та стилів з використанням вищезазначеного, ми, до певної міри, допоможемо у випадковому виборі наших публікацій. Роблячи це кожен раз, не залишаючи нічого уніфікованим, якщо тільки працюємо з неправдивими вказівками та червоними гарібами... ви повинні зберегти свою анонімність принаймні через текст.

Післямова

Рекомендується взяти те, що ви прочитали вище, і почати вигадувати свої власні тактики та підсилювачі. Діліться ними з ким завгодно і працюйте над забрудненням якомога більшої кількості інформації, щоб завадити будь-яким недосвідченим стилометристам в спробах розкрити осіб з анонімності. Приватність - це не одноразова справа. Це потребує багато терпіння, часу і досліджень. Тож візьміть те, що ви можете вивчити з вищезазначеного, і спробуйте знайти щось, що буде працювати для вас.

Джерела

Stylometry: https://eldritchdata.neocities.org/CGFTPU/Stylometry.html