tag:blogger.com,1999:blog-9184507877749766768.post7095664718616776816..comments2022-01-05T11:51:30.220+03:00Comments on Есть табак, да нечем нюхать: Навигация в мире органических соединенийDmitryhttp://www.blogger.com/profile/09876968556571551632noreply@blogger.comBlogger4125tag:blogger.com,1999:blog-9184507877749766768.post-89797912666500541712010-07-18T01:03:53.333+04:002010-07-18T01:03:53.333+04:00Игорь,
2-й, 3-й, 4-й и 5-й примеры были действите...Игорь,<br /><br />2-й, 3-й, 4-й и 5-й примеры были действительно позаимствованы из набора SimBioSys. Однако, насколько мне известно, этот набор появился задолго до выхода OSRA, следовательно, упрекнуть SimBioSys в пристрастном отношении к OSRA мы не можем :)<br /><br />Сейчас я добавил ещё один, 6-й пример, он тоже не от SimBioSys. <br /><br />Jungap Park и компания тестировали не последнюю версию CLiDE, и честно написали об этом.<br /><br />Спасибо за ссылку на ChemReader. Кажется, этот продукт находится в такой же закрытой разработке, как и ChemoCR, и, что забавно, содержит open-source компоненты, <a href="http://baoilleach.blogspot.com/2009/02/new-software-for-ochre-chemreader.html" rel="nofollow">которые авторы собираются из него устранить</a>.<br /><br />Согласен, что было бы неплохо прогнать CLiDE на тестовом наборе из 5735 картинок, но мы этого сделать уже не можем, т.к. истёк срок trial лицензии.Dmitryhttps://www.blogger.com/profile/09876968556571551632noreply@blogger.comtag:blogger.com,1999:blog-9184507877749766768.post-65080749567231456662010-07-16T23:49:43.788+04:002010-07-16T23:49:43.788+04:00Дмитрий,
Спасибо за примеры. Насколько я вижу по ...Дмитрий,<br /><br />Спасибо за примеры. Насколько я вижу по крайней мере структуры<br />3 и 4 взяты из CLiDE validation set, про остальные не скажу, но<br />возможно они тоже из набора предлагаемого самими же SimBioSys?<br /><br />Есть другие примеры. Авторы аналогичной программы ChemReader<br />например находят что CLiDE далеко позади и OSRA и ChemReader.<br />"Automated extraction of chemical structure information from digital raster images." Jungkap Park, Gus R Rosania, Kerby A Shedden, Mandee Nguyen, Naesung Lyu and Kazuhiro Saitou<br />Chemistry Central Journal 2009, 3:4<br />http://journal.chemistrycentral.com/content/3/1/4<br /><br />Есть так же другие наборы данных. OSRA использует 5735 изображений из набора USPTO, он открыт для всех, вместе с ground truth.<br />Есть так же независимый набор структур из Japan Patent Office:<br />http://www.iapr-tc11.org/mediawiki/index.php/Chem-Infty_Dataset:_A_ground-truthed_dataset_of_Chemical_Structure_Images<br /><br />Было бы очень интересно посмотреть независимое сравнение по одному из этих наоборов изображений. Хотя набор USPTO был доступен уже несколько месяцев пока никто кроме OSRA не сделал<br />результаты работы их программ доступными.<br /><br />ИгорьAnonymousnoreply@blogger.comtag:blogger.com,1999:blog-9184507877749766768.post-47034992280072542252010-07-16T21:24:28.730+04:002010-07-16T21:24:28.730+04:00Игорь, здравствуйте
Спасибо что зашли :)
В комме...Игорь, здравствуйте<br /><br />Спасибо что зашли :)<br /><br />В комментариях тут нельзя постить картинки, поэтому я добавил их в конец текста. Это уменьшенные копии; оригиналы показываются по нажатию. CLiDE распознаёт их правильно.<br /><br />Статья не претендует на исчерпывающее сравнение CLiDE и OSRA. Само собой, существут примеры, на которых OSRA превосходит CLiDE, но их субъективно меньше.Dmitryhttps://www.blogger.com/profile/09876968556571551632noreply@blogger.comtag:blogger.com,1999:blog-9184507877749766768.post-55433311589549761852010-07-16T01:29:33.368+04:002010-07-16T01:29:33.368+04:00Мне было бы очень интересно посмотреть на
конкретн...Мне было бы очень интересно посмотреть на<br />конкретные результаты тестов/примеров где OSRA "обладает на данный момент худшим качеством распознавания".<br /><br />Спасибо,<br />ИгорьAnonymousnoreply@blogger.com