Скачивание Википедии

573
bill

Как я могу загрузить определенный набор базы данных Википедии? В частности, я заинтересован в загрузке всех статей, которые попадают под портал математики и, возможно, портал компьютерных наук. Как я могу это сделать?

1

4 ответа на вопрос

3
ssssteffff

You can use a software called Kiwix, which is really easy to use.

EDIT

Wikipedia provide a tool to extract a subset of its content. You can search for "Mathematics" here, and then export every article within this category. You'll get a .xml file which you can browse using one of the listed tools here.

Если вы попытаетесь использовать `Special: Export` таким образом, он будет экспортировать только 7 статей, которые находятся непосредственно в разделе" Категория: Математика ", а не любые другие десять тысяч математических статей в Википедии. svick 10 лет назад 0
2
Tobi

Вы можете использовать Media Wiki API .

Было бы здорово, если бы вы могли немного расширить свой пост, объясняя, как добиться того, что нужно ОП. slhck 10 лет назад 5
2
Eduard Florinescu

You can take the *-pages-articles.xml.bz2 from Wikimedia backup dumps site and process them with WikiTaxi(download in upper left corner). Wikitaxi Import tool will create a .taxi(around 15Gb for Wikipedia) file out of the .bz2 file. That file will be used by WikiTaxi program to search through articles. The experience is very similar to the browser experience, with all articles available to the time of the dump, but without the images.

Or you can use Kiwix faster to setup because has the database is already made (but quite old), but WikiTaxi has the advantage that you can have the latest updated content.

1
living being

перейдите на en.wikipedia.org на левой боковой панели, в разделе «Инструменты», нажмите «Специальные страницы».

На новой странице в разделе «Инструменты страницы» нажмите «Экспортировать страницы».

на новой странице введите название каждой категории, которую вы хотите. Например, введите математика (как показано на рисунке ниже) и нажмите Добавить.

enter image description here

Затем вы должны установить Mediawiki и перейти по аналогичному пути и выбрать «импортировать страницы».