Немного культуры или бот с известными картинами

Уже несколько недель на моем твиттере аккаунт хула-бота, который я, кстати, сделал, играя с данными из Википедии. Три раза в день публикуется случайно выбранное изображение вместе со ссылкой на его описание в Википедии. Сложно сказать об эффектах, поэтому вкратце об идее и ее реализации.

Сложно сказать об эффектах, поэтому вкратце об идее и ее реализации

В марте мне понадобились данные для одного из проектов, которые содержали бы географические координаты. В то время я вспомнил идею загрузки данных из Википедии, которая сейчас скрыта, а теперь, когда проект Wikidata - база семантических знаний - сильно укреплена, относительно прост.

Wikidata, а точнее на польском Wikidane, если кто-то не знает, - это очень интересный проект, разработанный в течение нескольких лет Фондом Викимедиа, который получил большую поддержку Google, когда прекратил разработку своего аналогичного проекта Freebase. О семантическом интернете говорят уже добрые несколько лет, но теперь это действительно начинает происходить, и я думаю, что через год или два Викидан станет для нас одним из наиболее важных источников сбора данных.

В чем разница между Википедией и Викиданами? Немного упрощенно, в первом случае знания собираются в статьях, которые сгруппированы различными способами, например, в форме списков. Википедия состоит из многих (более 200) национальных версий, в которых большое количество паролей накладывается, но размер и содержание статей обычно различаются. Wikidane - это идея для сбора фактов и информации в одной независимой от языка базе данных, а объекты и их свойства имеют уникальные идентификаторы. Спасибо, например, если мы спросим о «Федерика Шопена», то Викидан найдет ту же информацию, которую мы хотели бы спросить о «Фредерик Шопен».

К сожалению, нет ничего бесплатного. В то время как Википедию может использовать практически любой, кто может ввести поисковый запрос в поисковик, в случае с Викиданами нам нужно создавать мини-скрипты на специальном языке SPARQL. Это не очень сложно, но для тех, кто никогда не программировал, это, несомненно, будет проблемой. Сложность обучения использованию Wikidani вознаграждается совершенно новыми возможностями получения информации. Например, менее чем за минуту мы можем найти композиторов, которых назвали «Ян». Это скрипт, который выполняет задачу:

ВЫБЕРИТЕ «Персона» Персона ГДЕ? {Персона wdt: P106 wd: Q36834; # Человек занимается составлением wdt: P735 в: Q12173670. # Имя этого человека: Jan SERVICE wikibase: label {bd: serviceParam wikibase: язык "[AUTO_LANGUAGE], en". }}

Посмотрите, как это выглядит эффект от сценария ,

Выполняя некоторые упражнения в SPARQL, я, вероятно, сделал несколько сотен различных запросов. Одним из них был запрос об изображениях, найденных в Викиданах. Я определил, что я хочу следующие элементы:

  • графический файл с изображением,
  • дата создания изображения,
  • имя и фамилия художника
  • и место, где находится картина.

Кроме того, я поручила скачать ссылку на статью в Википедии для каждого изображения - потому что мне нравится читать что-то, что мне нравится, и в статьях часто содержится очень интересная информация, например, об истории картины, ее судьбе, людях или местах, которые она представляет, и т. Д. Я также ограничил загрузку только польской Википедией, потому что, во-первых, из всей википедии скрипт загружал десятки тысяч изображений, а во-вторых, я подумал, что, возможно, если статьи написаны на польском языке, пользователи Интернета с большей вероятностью их прочитают.

В общем, мой скрипт искал 2150 изображений, которые соответствовали всем условиям, то есть это был графический файл, дата создания изображения, автор и ссылка на статью в польской Википедии.

Когда я увидел изображения и дополнительную информацию о них, я сразу подумал о создании бота для него, который будет опубликован в Twitter. Создание скриптов-машин не секрет для меня и несколько таких работ на моем аккаунте, поэтому через 10 минут новый бот был готов, что три раза в день:

  • выполняет запрос к Викиданам и загружает изображения и данные о них
  • удаляет те, которые уже были опубликованы
  • рисует одну из картин
  • из данных изображения он создает описание
  • опубликовать твит
  • сохраняет изображения, уже опубликованные в специальном файле

Описание создано шаблон, где предопределена часть текста, а также некоторые элементы, такие как название картины, имя художника и т. д. они вставляются из данных изображения. Кроме того, скрипт бота рассчитывает количество лет, прошедших с момента создания образа.

И так работает сценарий, и в течение примерно трех недель, включая различные попытки, «опубликовано» 61 изображение. Я добавил хештег #odrobinaKultury, чтобы вы могли легко сгруппировать опубликованные изображения, например, когда кто-то пропустил твит или ушел в отпуск. Маленькая вещь и полезная.

Как я уже говорил, одной из причин создания бота была готовность использовать знания в использовании Wikidanes. Вторая причина была связана с наблюдением за Твиттером, в котором много политики, что меня совсем не беспокоит, но, к сожалению, интересные обмены мнениями, которые были заменены «столкновением булав» с антагонизированными страницами, куда-то исчезли. В результате, после 5 минут чтения я прекрасно знаю, что такое «сообщения дня» и какие аргументы будут использовать заинтересованный твиттер. Это скучно в долгосрочной перспективе. Поэтому я подумал, что, возможно, с одной стороны, картины великих художников будут немного влиять на горящие головы, что, по крайней мере, затуманивает их глаза и заставляет задуматься об изображении. Это удалось? Я не знаю и скорее сомневаюсь. Во-вторых - с чисто эгоистической точки зрения - я хотел, чтобы каждый день было несколько изображений, которыми я мог бы наслаждаться глазом.

Через несколько недель я могу с уверенностью сказать, что эта ежедневная доза искусства очень приятна для меня, и сценарий о Папе не звонит, поэтому он останется на данный момент. Единственный вопрос, который у меня есть, это вопрос, стоит ли переносить бота из моего аккаунта в другой - посвященный. В мире большинство авторов ботов делают это. У меня нет готового ответа здесь. Есть преимущества этого решения как для меня, так и для тех, кто хочет видеть фотографии. Пока это остается на моем счету, потому что я чувствую что-то в этом роде, перевод на выделенный закончится тем, что, вероятно, большая часть картин просто не будет замечена.

Если у вас есть какие-либо комментарии, предложения, комментарии, пожалуйста, либо ниже, под текстом, либо на щебет

Если кто-то еще не видел изображения, опубликованные с помощью хештега #odrobinaKultury, просто нажмите на эта ссылка чтобы увидеть опубликованные ранее.

В чем разница между Википедией и Викиданами?
Это удалось?