EN|RU|UK
 Общество
  1320  3

 Библиотека Конгресса перестанет собирать все публичные твиты - не хватает ресурсов для обработки

Крупнейшая библиотека мира с 2010 года копировала все публичные записи из Twitter. Также в ней хранился архив компании со времени появления этой соцсети в 2006 году.

Об пишет Цензор.НЕТ по информации сайта Meduza.io, ссылающегося на сообщение библиотеки.

Библиотека Конгресса с 2018 года прекратит добавлять в свой архив все без исключения публичные записи, но продолжит собирать твиты на выборочной основе: они будут разбиты по темам и привязаны к конкретным событиями.

“Принятое решение объясняется тремя обстоятельствами. Во-первых, количество записей в твиттере за последние годы радикально выросло. Во-вторых, библиотека архивирует только текст твитов, в то время как они все чаще содержат изображения, видео и ссылки. В-третьих, максимальная длина твита увеличилась вдвое”, - говорится в сообщении.

Библиотека Конгресса копирует все публичные записи из твиттера с 2010 года. Кроме того, компания Twitter передала библиотеке архив публичных твитов с 2006 года (времени появления твиттера).

Открытого доступа к архиву Библиотека Конгресса не предоставляет. Когда доступ будет открыт, неизвестно. Собранные твиты никак не упорядочены, системы поиска по архиву нет. У библиотеки не хватает ресурсов для обработки собранной информации.

В Twitter каждую секунду публикуют около шести тысяч записей — это примерно 500 миллионов твитов в день или 200 миллиардов твитов в год.

Источник: https://censor.net.ua/n3041862
Комментировать
Сортировать:
в виде дерева
по дате
по имени пользователя
по рейтингу
 
 
 
 
 
 вверх