Pere
[Начало] [Що нового] [Перевести текст] [Перевести файл] [Що це і навіщо] [Як отримати] [Як встановити] [ЧаПи] [Українська] [English]

ЧаПи

Как ни найдете ответа вопрос, которое Вас беспокоит, то листуйте мне.

П:

Какое отношение имеет "Пере" в программу "Плай(tm)" ("L-Master" и "ПАРС/У", и т.д)?

В:

Абсолютно никакого.

П:

Какие языковые пары можно сделать. Что этого нужно? Надо создавать какие-то словари?

В:

Сделать можно, по идее, любые. Точно можно для европейских и им подобных.

С целью нужны не только двуязычные тексты. Во время учебы переводы находят "с ноля" и потому никакие стартовые словари без надобности. Хотя их наличие ускорит работу.

П:

Хотел только спросить, будет ли та переводчица когда-нибудь подсматривать в контекст перекладаного текста, чтобы немного согласовывать рода - например, вместо "мое образование" ("мое образование") писать "МОЮ образование". Поскольку плюс является и тот, что она более-менее верно определяет падежи. Или, в связи с спецификой работы переводчицы, такого не будет?

В:

Наоборот, она только и делает, что смотрит контекст. По этой ее специфику - будет, со временем, полнее согласовывать, но о которых объемов сырья надо затем, чтобы достичь "человеческой" качества, сейчас не знаю. Тем более, что само сырье не "рафинированное", она имеет очень много ошибок. Чтобы ошибки не приобретали систематического характера переводчицу нужно "кормить" разнообразной сырьем. Собственно потому и прошу всех предоставлять сырье или источники получение.

П:

Не знаю, как учить переводчицу на білінгвах (ливней себе). То Есть, есть две тексты: один украинской, другой - российской. Стоит вопрос: как натравити Pere эти тексты, чтобы он их "изучила"? К сожалению, это совсем не ясно с подсказок в файлах...

В:

Под Artistic/GPL/FDL идут результаты обучения.
Сам же обучающий модуль но я никак, что что связано, когда есть публичным:

  • алгоритм обучения как уже стабилизировался, но всё очень сырой;
  • технология полностью не отработана;
  • к нему являются убежденными и и некоторые другие планы.

Когда тексты как и сугубо частными, то пришлите их мне.

Если хотите исправить свои ошибки, так это можно сделать в оригинальном src-файлі, лучше ли в отдельном, с последующим добавлением его к словарю командой pere-src2dic. Но, конечно, Ваши исправления с трудом затронут словари с pere.org.ua и, больше того, могут с которыми в будущем конфликтовать.

П:

Относительно CSV, или какие-то требования по "шапки" (первого строки) - или выглядеть ей, как вашем словаре, это или нет такой значимости?

В:

Так, требования есть. поскольку словари распространяются в двух форматах: как сырце и как дамп.

Сырце а ее файл в формате CSV, имеющий заголовок: PERE_DICT_SOURCE,0.2.0,"2006-05-23 12:05:11".
Где первое поле - это "подпись формата", второе - версия, третье - время создания.
Далее следуют собственно переводы в виду: "вхідна фраза","вихідна_фраза"[,"вихідна_фраза",...].

Дамп а ее файл в формате CSV, имеющий заголовок: PERE_DICT_DUMP,0.2.0,"2006-05-22 16:07:04".
Где первое поле - это "подпись формата", второе - версия, третье - время создания.
Далее следуют данные позволяют в кодованому виде: "назва таблиці","ключ","значення".
Кодирование - это шістнядцяткове текстовое представления двоичных данных.

П:

Если запихнуть в словарь и два варианта перевода одной и той же фразы, какому из вариантов программа предпочтет?

В:

Если есть несколько вариантов перевода, то программа выбирает одном из них случайным образом.

Если хотите чтобы работало иначе, то поменяйте функцию Lingua::Pere::Misc::randval.

П:

Тогда, возможно, в случае станет от такой идеи: [... изложение идеи ...].
Просто (правда, будучи программистом, не лингвистом) попытался представить, как же сам перевожу из одной языка другой.

В:

Ваши идеи с удовольствием выслушаю наверное ними воспользуюсь. Но хотелось бы, чтобы они были более конкретными, нацеленными реализации, потому что тоже программист, нежели лингвист.

Собственно перевод и обучения почти с трудом связанные. Чисто перевод представлены в очень модельном состоянии, чтобы показать, что состоялось. Вы же сами вполне можете написать при любом варианте использования словаря для перевода, в том числе и тот, что предлагаете. Именно поэтому результат образования и идет под GNU GPL и GNU FDL.

Когда напишете, то закиньте, пожалуйста, мне - пусть другие тоже воспользуются.

ІНШІ ПРОЕКТИ [Словарь] [Pere.SF.NET] [Linux.Org.UA]
flag Copyleft (L) 2003-2017,
Киев, Соломко Валентин