You are hereпроект Гутенберг

проект Гутенберг

warning: Creating default object from empty value in /home/ebookua/public_html/modules/taxonomy/taxonomy.pages.inc on line 33.

2000: Програми пошуку помилок

Задумані у жовтні 2000 року Чарльзом Франксом розподільчі програми пошуку помилок були запущені онлайн у березні 2001 року, щоб допомогти в оцифруванні книг для вільного доступу. Це метод позбавлення втомлюючої роботи з перевірки помилок у малих частинах книги. Призначені спочатку для того, щоб допомоги проекту Гутенберг в обробці окремих коректорів, розподільчі програми пошуку помилок стали основним джерелом проекту електронної книги Гутенберга. У 2002 році, розподільчі програми пошуку помилок стали офіційним сайтом проекту Гутенберг. Кількість книг, що обробляються за допомогою розподільчих програм пошуку помилок швидко зростала. У 2003 році близько 250-300 людей у всьому світі працювали кожен день над обробкою 2500-3000 сторінок на день, зі швидкістю дві сторінки за хвилину. У 2004 році в середньому 300-400 коректорів брало участь щодня, щоб закінчити 4000-7000 сторінок, що еквівалентно 4 сторінкам за хвилину. Розподільчі програми пошуку помилок обробляли близько 3000 книг в лютому 2004, 5000 книг у жовтні 2004, 7000 книг у травні 2005 року, 8000 книг у лютому 2006 року 10 000 книг у березні 2007 року за допомогою 36 тисяч волонтерів.

В основному, швидкий розвиток проекту Гутенберг з 2000 року відбувся завдяки розподільчим програмам пошуку помилок. У 2002 році, розподільчі програми пошуку помилок стали офіційним сайтом проекту Гутенберг. У травні 2006 року, розподільчі програми пошуку помилок стали окремою організацією і продовжують підтримувати тісні стосунки з проектом Гутенберг.
Добровольці не зобов’язані виконувати якусь певну частину, але, якщо можливо, бажано виконувати сторінку на день. Це на перший погляд здається дуже мало, але завдяки сотням добровольців це надзвичайно багато. У грудні 2007 року, п'ять книг на день випускалось тисячами добровольців.
На сайті можна отримати доступ до програми, яка дозволяє декільком коректорам працювати над однією і тією ж книгою в той же час, причому кожен коректор може працювати над іншою сторінкою. Це значно прискорює процес редагування. Добровольці, зареєструвавшись, отримують докладні інструкції. Наприклад, слова жирним шрифтом, курсивом, підкреслені слова або виноски завжди трактуються однаково для будь-якої книги. Форум дозволяє їм задавати питання і звертатися за допомогою у будь-який час. Керівник проекту контролює хід роботи над певною книгою різними способами на сайті.
Веб-сайт надає повний список книг, які: (а) завершені, тобто ті, які пройшли через сайт і розміщені у проекті Гутенберг; (б) ті, які ще в процесі, тобто перебувають на сайті, але ще не опубліковані, оскільки на даний час остаточно коригуються і збираються; (с) книги, які на даний час опрацьовуються. На 3 серпня 2005 року, 7639 книг були завершені, 1250 книг знаходились в процесі і 831 книга якраз опрацьовувалась. На 1 травня 2008, 13039 книг були завершені, 1840 книг знаходились в процесі і 1000 книг опрацьовувались.
Кожного разу, коли волонтер (коректор) заходить на сайт, він/вона обирає будь-яку книгу. Тоді одна сторінка книги з’являється одночасно у двох формах: у вигляді відсканованого зображення і друкованої версії текстової сторінки (в результаті програмного забезпечення OCR). Коректор може легко порівнювати обидві версії, виявляти відмінності і виправити їх. OCR, як правило, на 99% точно виправляє, роблячи близько десяти коректувань на сторінку. По закінченню редагування коректор зберігає кожну сторінку і після цього припиняє роботу або починає роботу з іншою. Книги перевіряють два рази, другий раз перевіряють тільки досвідчені коректори. Усі сторінки книги потім відформатовуються, комбінуються і збираються пост-процесорами в одну електронну книгу. Після цього електронна книга готова бути розміщеною з елементом індексу (заголовок, підзаголовок, автор, номер книги і характерний зміст) у базі даних. Індексатори продовжують каталогізацію (дата народження та смерті автора, класифікація в Бібліотеці Конгресу, і т.д.) після виходу.
Волонтери можуть працювати самостійно, безпосередньо після звернення до проекту Гутенберг, набираючи книги за допомогою будь-якого текстового редактора або текстового процесора. Вони можуть також перевірити його і перетворити в текст з програмним забезпеченням OCR, а потім внести коректування, порівнюючи цей текст з оригіналом. У будь-якому випадку, хтось інший все-одно буде коректувати його. Вони можуть використовувати формат ASCII чи будь-який інший формат. Ми із задоволенням запрошуємо всіх, незалежно від способу і формату, які використовуються.
Ми ласкаво запрошуємо нових добровольців для роботи з розподільчими програмами пошуку помилок, розподільчим програмами пошуку помилок Європи і Канади. Також запрошуємо усіх добровольців для роботи із різними мовами. В нас тут багато роботи. Як оголошено на обох сайтах: "Пам'ятайте, ви ні до чого не зобов’язані. Ви можете коригувати помилки тоді, коли Вам зручно і опрацьовувати стільки сторінок скільки хочете. Ми заохочуємо людей виконувати одну сторінку на день, але все залежить тільки від вас! Ми сподіваємося, що ви приєднаєтесь до нас у нашій місії по "збереження літератури світової історії у вільно доступній формі для використання".

Розповісти

Share this

Яндекс.Метрика