Тема: Шахматы: шахматы для компьютера скачать бесплатно, шахматы онлайн играть с компьютером. Новости шахмат. Статьи о шахматах. :: Chessbase - удаление дублей

Прислано Regulus 25-01-2014 14:55
#1

Всем привет!
Есть тут спецы по удалению дублей из продуктов Chessbase (а именно Chessbase 9)?
Конкретно:
i57.fastpic.ru/big/2014/0125/76/a2c3be15f8336fa0ee7a1589be0ade76.jpg
Какие галочки нужно правильно выставить, вот в чем вопрос?
Собираюсь сделать книгу - сборную солянку из партий чисто для себя :)

Редактировал Regulus 25-01-2014 14:56

Прислано Zunkor 25-01-2014 15:17
#2

Я когда-то давал инструкции в закрытом разделе.

На первом этапе поиска дублей надо выставить: имена "Похожие", турниры "Игнорировать", ходы "Точно".
Разные оболочки неодинаково сохраняют имена игроков и названия турниров, поэтому точное совпадение лучше не выставлять.
После первичного поиска дублей я рекомендую выставить: имена "Похожие", турниры "Игнорировать, ходы "Похожие", галочку "дубли в буфер" и просмотреть найденные дубли.
Иногда партии сохраняются на предпоследнем ходу. Например, партия длилась 90 ходов, но у одного игрока она сохранилась после 89 хода, а у другого после 90. При просмотре дублей это сразу видно.
Потом, я рекомендую поставить галочку "игнорировать результат" и ещё раз поискать дубли. Некоторые умники специально обрезают партии в своих базах после определённого хода и вручную выставляю результат, который может отличаться от первоначального результата партии.
На последнем этапе надо выставить: имена "Игнорировать", турниры "Игнорировать" ходы "Точно", галочку "дубли в буфер"
У иностранцев, иногда, при сохранении имени игрока, содержащего кириллицу, нарушается кодировка и имя сохраняется в виде "абракадабры" или вообще не сохраняется. Выловить такие дубли можно только по точному соответствию ходов и дате.
На последних трёх этапах надо самому просматривать и удалять найденные дубли в буфере, потому что среди дублей могут попадаться очень похожие партии.

Редактировал Zunkor 25-01-2014 15:24

Прислано Regulus 01-12-2015 22:47
#3

Приветствую!
Нужна помощь специалистов опять же, по тому же вопросу, как удалить дубли из Chessbase?
Конкретно, четкие инструкции по пунктам, как вычистить базу, например сервера ИКЧФ, от злостных дублей?
1. First game и Number of moves - какие должны быть эти параметры;
2. Игнорировать результат и игнорировать дату, нужно ли их включать?
3. Имена, турниры, ходы - какие тут должны быть параметры.
Хорошо бы расписать бы четко поэтапно.
Буду очень благодарен!
P.S.Делаю свой шахматный форум, ставку делаю на информативность, а не на флейм :)

Прислано Zunkor 02-12-2015 12:19
#4

Regulus написал:
Приветствую!
Нужна помощь специалистов опять же, по тому же вопросу, как удалить дубли из Chessbase?

Разве я не дал конкретную, чёткую и поэтапную инструкции, как удалить дубли из Chessbase?
Базу партий ИКЧФ можно вычистить от дублей так же, как и базу Playchess.
По остальным вопросам все ответы есть в справке к Chessbase.

Первая партия (First game)

Если Вы добавили небольшое количество партий к большой базе, то можете начать поиск дублей не по всей базе, а начиная с номера добавленных партий. Это экономит время, так как ChessBase не должна будет проверять все партии в базе.

Число ходов Number of moves

Проверка очень коротких партий как правило, зря занимает время. Вы можете этого избежать, выбирая минимальную длину партии. Например, если указано "8" - партии меньше 8 ходов при поиске дублей рассматриваться не будут.

Дубли в буфер

Копирует дубли в буфер обмена базы. Вы можете найти их там, если захотите проверить.

Игнорировать результат

Если качество партий в базе очень низкое, то бывает что записана одна и та же партия, но с разным результатом. Вы можете заставить ChessBase все равно идентифицировать дубль. Время поиска в этом случае несколько возрастет, но и дублей может быть найдено больше.

Игнорировать год

Иногда даже год может быть указан неверно. В этом случае Вы можете заставить ChessBase при поиске дублей игнорировать год.

Имена точно / похоже / игнорировать

Если Вы выбираете Похоже, то очень похожие написания имени будут рассматриваться как одно имя, например. Mülller = Muller, Yussupov = Jussupow, Kortschnoj = Korchnoi и т.д. Заглавные и маленькие буквы будут также игнорироваться.

Турниры точно / похоже / игнорировать

Турниры с похожими названиями будут рассматриваться как идентичные.

Ходы точно / похоже / игнорировать

Еще один критерий, который определяет, насколько точно ChessBase должна сравнивать партии. Если Вы ходите чтобы были найдены все, даже отдаленно напоминающие одни и те же партии, отметьте Игнорировать. ChessBase будет сравнивать партии не по ходам, а только по дебютной классификации ECO. Это, вероятно, даст довольно много похожих партий, которые дублями, однако не являются.

Всегда удалять 1-ю/2-ю партию

Обычно ChessBase удаляет первую партию, когда находит дубль, но при условии что другая, более свежая и качественная. Если у Вас хорошая, качественная база, и Вы в нее скопировали партии, то при проверке на дубли укажите Всегда удалять 2-ю. Таким образом, при нахождении дубля будет удалена партия из вновь скопированных.

Держать 'лучшую' партию

Лучшая партия - партия с более детальными данными заголовка подобно рейтингам Эло, источнику публикации, именам, и т.д.

Удалить партии с примечаниями

Партии с примечаниями исследуются программой особенно. Обычно программа не удаляет партии содержащие комментарий, чтобы не потерять нужную информацию. Но если Вы укажите Удалить партии с примечаниями, то они будут удаляться подобно другим дублям.

Объединить партии с примечаниями

Если Вы выберите эту опцию, партия с меньшим номером будет объединена с другой. Вставленные примечания будут выделены. Таким образом, партия с меньшим номером будет заменена объединенной версией.

Заменить партии с примечаниями

Если Вы импортировали подборку комментированных партий, обычное удаление дублей может затронуть и партии входящие в турниры, что нарушит их порядок. Чтобы этого избежать выберите функцию Заменить партии с примечаниями. ChessBase просто заменит оригинальную партию, возможно входящую в турнир, на ее комментированную версию.

Удаление дублей физически не удаляет партии из базы, а лишь отмечает их для удаления. Если Вы хотите их удалить, то выделите значок данной базы и выберите Инструменты – База данных – Убрать удаленные партии или щелкните правой кнопкой по значку базы, содержащей партии, помеченные для удаления (зачеркнутые), и выберите в меню: Инструменты – Убрать удаленные партии. Это действие необратимо.

Лично я на первом этапе поиска дублей использую такие настройки:

Редактировал Zunkor 02-12-2015 12:28

Прислано Zunkor 03-01-2021 15:11
#5

Присылают базы Плайчесса с большим количеством дублей.
Рекомендую всем проверять базы по инструкции из предыдущего сообщения.
Параметр "Имена" обязательно надо выставить "Похожие", а параметр "Турниры" выставить "Игнорировать"
Это позволяет выявить очень много дублей.

www.gladiators-chess.ru/images/Dubli.jpg

Рекомендую, также, проверять базы на дубли разными версиями ChessBase.
Например, ChessBase 9 может находить дубли, которые не находит ChessBase 15 и наоборот, ChessBase 15-16 находят дубли, которые не находят более старые версии.