Навіщо журналістам архівувати інформацію на сайтах? За оцінками досліджень, понад третина вебконтенту зникає протягом кількох років. Для розслідувань, приміром, це означає: якщо ви не зафіксували інформацію — її може не існувати в момент, коли вона стане доказом.
Тож у цьому матеріалі ми рокажемо більше про те, як робити архівування. Корисні поради для ваших медіа підготували на основі практичного воркшопу, який відбувся під час поїздки учасниць проєкту «Сильніші Разом: прозорість і боротьба з корупцією» до Норвегії. Сесія була присвячена тому, як архівування вебданих стає критичним інструментом у журналістських розслідуваннях — від фіксації доказів до викриття маніпуляцій. Про можливості Wayback Machine розповів директор Internet Archive Mark Graham.
Чому архівування — базова навичка журналіста
Інтернет не є стабільним середовищем: сторінки зникають, тексти редагуються, доступ до сайтів обмежується.

— Інтернет не зберігається сам. Його потрібно свідомо архівувати. І дуже часто саме журналісти стають тими, хто це робить, — пояснює Mark Graham.
Архівування — це не лише про збереження. Це про можливість довести:
- що саме було опубліковано
- коли це з’явилося
- як це змінювалося
Практичні кейси: як архів стає доказом
Під час воркшопу спікер навів кілька показових прикладів використання архівів у журналістиці. Наприклад, коли «The New York Times потрібно було довести, що на сторінці була конкретна графіка. Ми змогли підтвердити це — не лише сам факт сторінки, а й усі її елементи. Це і є сила архіву», — сказав Mark Graham.

«Ще один кейс — заархівували матеріал під назвою MediaFilter. У ньому йшлося, що серед мусульман зростає занепокоєння, ніби китайська COVID-вакцина містить свинячий желатин. Згодом з’ясувалося, що цей матеріал, ймовірно, був розміщений урядом США. Є розслідування Reuters, яке показало, що американські військові могли проводити інформаційну кампанію проти Китаю. Тобто вони поширювали повідомлення в китайських соцмережах, щоб підірвати довіру до вакцини. І частково журналісти Reuters змогли це довести саме тому, що ці матеріали були заархівовані», — цитуємо спікера.
Невдовзі після повномасштабного вторгнення росії в Україну, спеціалісти почали ідентифікувати культурні матеріали в Україні, які можуть бути під загрозою, намагатися їх архівувати.
Також Internet Archive активно працює з Wikipedia. Їм вдалося знайти і виправити понад 30 мільйонів «битих» посилань у статтях.
— Дослідження Pew Research Center показало, що 38% вебсторінок за 10 років зникають. Тобто інтернет буквально «розсипається». Ми займаємося цим уже 30 років, тому зберегли значну частину — хоча й не все. Ми також пов’язуємо різні джерела між собою. Наприклад, стаття про Martin Luther King Jr. у Wikipedia може містити посилання на книгу, і ця книга доступна в Internet Archive. Загалом у нас понад вісім мільйонів оцифрованих книг. Ми купили книгарню Better World Books, передали її неприбутковій організації — там 30 мільйонів книг, з яких орієнтовно мільйона щороку оцифровують. Це 3000 книг щодня. Також архівуємо понад 35 мільйонів наукових статей і багато телевізійного контенту. Зараз ще архівуємо 70 новинних телеканалів, багато з них — поза США. Коли почалося повномасштабне вторгнення Росії, я зрозумів, що не можу отримати доступ до російського телебачення, щоб зрозуміти, що там транслюють. Тому ми почали архівувати російські та українські телеканали. Ми додали близько 50 неамериканських каналів — з Ізраїлю, Ірану, Білорусі, Північної Кореї, Китаю, Тайваню тощо. Коли сайти або матеріали зникають після публікацій чи досліджень, архів часто залишається єдиним місцем, де їх ще можна побачити, — розповідає Mark Graham.
Як працює Wayback Machine
Тепер більше про те, як використовувати Wayback Machine та інші інструменти Internet Archive у журналістських розслідуваннях. Нижче до вашої уваги головні висновки з промови експерта.
Архів — це доказ, а не просто скріншот
Wayback Machine зберігає не просто вигляд сторінки, а повну її структуру: HTML, зображення, JavaScript, CSS. Одна сторінка може містити тисячі пов’язаних елементів і URL. Саме тому архів використовується в судах як доказ — він дозволяє підтвердити, що саме було опубліковано і коли.
Фіксація змін — ключ до викриттів
Близько 20% новин змінюються протягом перших 24 годин. Архів дозволяє порівнювати різні версії сторінок, відстежувати зміну заголовків і формулювань, знаходити додані або видалені елементи. Це критично для розслідувань, де важливо показати, як переписується публічна позиція або факт.
Архівування як проактивна дія журналіста
Один із ключових інструментів — функція Save Page Now. Вона дозволяє вручну зберегти сторінку, масово архівувати URL (через Google Sheets — до 70 000 посилань), використовувати API, email або браузерні розширення. Як наголошує спікер: якщо редакція готує розслідування і очікує, що матеріали можуть зникнути — їх потрібно заархівувати до публікації. Це спосіб зберегти докази.
Архівування — це поєднання автоматизації і відбору
Internet Archive щодня архівує близько 1 мільярда URL і вже зберіг понад 1 трильйон вебсторінок. Але повністю зберегти інтернет неможливо, тому частина процесів автоматизована, частина — залежить від редакційних рішень і користувачів. Журналісти фактично теж є частиною системи архівування.
Соцмережі і обмеження
- X (Twitter) архівується майже повністю
- YouTube і TikTok — вибірково (переважно через новинні згадки)
- Facebook та Instagram майже недоступні для архівування через технічні обмеження
Це означає, що частина цифрових доказів потребує альтернативних підходів.
«Сміття» як майбутній доказ
Контент, який сьогодні виглядає неважливим, завтра може стати доказом. Архів дозволяє фіксувати інформаційні кампанії, маніпуляції або скоординовані дії, які інакше просто зникли б.
Робота з великими масивами і нові можливості
Серед додаткових інструментів:
- пошук по тисячах URL одного сайту
- sitemap і структура сайту
- тематичні колекції
- повнотекстовий пошук по мільярдах документів
Окремий напрям — архівування телебачення з автоматичною транскрипцією і перекладом, що дозволяє шукати конкретні фрази у відео.
Як користуватися Wayback Machine
Wayback Machine — це сервіс Internet Archive, який дозволяє зберігати вебсторінки та переглядати їхні попередні версії.

1. Як знайти стару версію сторінки
- Перейдіть на web.archive.org
- Вставте URL сторінки у пошукове поле
- Натисніть Enter
- Відкриється календар із датами архівування
- Оберіть рік, дату, конкретний час
Після цього відкриється заархівована версія сторінки.
2. Як заархівувати сторінку
- На тій самій сторінці web.archive.org знайдіть блок Save Page Now
- Вставте URL
- Натисніть Save Page
Сервіс створить нову архівну копію і дасть окреме посилання.
3. Як перевірити, що саме збереглося
Після відкриття архівної сторінки:
- використайте функцію About This Capture
- Вона показує:
- коли збережено сторінку
- чи всі елементи (зображення, скрипти) завантажені
- технічні деталі архівування
Це важливо для перевірки достовірності.
4. Як порівнювати зміни
Wayback Machine дозволяє:
- відкривати різні версії сторінки
- вручну порівнювати текст, заголовки, структуру
5. Масове архівування
Якщо потрібно зберегти багато сторінок:
- можна використовувати списки URL (наприклад, через Google Sheets)
- система підтримує масове додавання посилань
Це застосовується у великих розслідуваннях, коли потрібно зафіксувати десятки або тисячі джерел.
6. Що варто враховувати
- не всі сайти можна заархівувати (частина соцмереж блокує це технічно)
- сторінка зберігається разом із багатьма елементами — тому процес може займати час
- архів не гарантує збереження кожної зміни сторінки
- частина контенту може бути недоступною через обмеження доступу або геоблокування
Сподіваємося, ця інформація була для вас корисною і допоможе впевненіше використовувати архівування у своїй роботі. Команда АНРВУ продовжить ділитися практичними кейсами, інструментами та досвідом, які учасниці привезли з поїздки.
Підписуйтеся на сторінки Асоціації, щоб не пропустити важливого:
Читайте також:
SKUP 2026 для українських медіа: головні висновки журналістів після поїздки до Норвегії
SKUP 2026: головні теми, практичні воркшопи й ТОП висновки для українських редакцій
***
Нагадаємо, що програма «Сильніші разом: Медіа та Демократія» реалізується АНРВУ у партнерстві з WAN-IFRA та Норвезькою асоціацією медіа (MBL) за підтримки Норвегії.










