E-mail: Пароль: Регистрация Восстановить пароль

Авторы Контакты Принять участие in English

показывать

Продвинутый поиск изображений насекомых в Сети

Сообщество и ФорумНовостиПродвинутый поиск изображений насекомых в Сети

Петр Храмов, 25.04.2016 22:03

UP 15.05.2016: Господа, потестите предварительную версию поиска изображений: http://ist.insecta.pro (см. сообщение ниже).

Если искать фоты, к примеру, насекомых (или другой живности) в Гугол/Яндекс.Картинках по названиям этих самых насекомых, то можем встретить две большие проблемы:

1. ГуголЯндекс учитывает тексты вокруг картинки и прочее, и прочее, в результате чего будет найдено много всяческого мусора, причем по картинкам зачастую будет неочевидно, оно это, собственно, или не оно. Особенно актуально для видов, у которых мало фот в интернетах.
2. По запросу вышестоящего таксона (например, трибы) будут выводиться фоты именно с подписями, где имеется название трибы, а нам часто нужно, чтобы выводились еще и фоты всех нижестоящих таксонов.

Вопрос: если будет штуковина, которая будет искать картинки насекомых в Сети и которая при этом лишена недостатков из пп.1—2, сильно это облегчит вам жизнь?

З.Ы. Ясное дело, что остается еще п.3 под названием "автор фото сам не знал, что выкладывал в Сеть, и определение его неадекватно", но это уже совсем проблема с совсем другими методами решения...

Комментарии

26.04.2016 1:32, Юрий Семейкин

Чтобы ответить , надо попробовать. А так навскидку, навряд ли сильно облегчит.

26.04.2016 10:25, Евгений Комаров

Тоже подозреваю, что не дюже поможет. Уж больно много неадекватных определений в сети и искать там "жемчужное зерно" ... Есть сайты, которым доверяешь, вот ими как правило, и пользуешься. Но Юрий прав - попробовать надо, чтобы уверенно говорить.

26.04.2016 11:42, Петр Храмов

Что одни раз лучше увидеть — это понятное дело...

27.04.2016 19:07, Иван Пристрем

А что, если составить каталог достоверных интернет-источников и сделать так, чтобы сервер искал изображения только в них? Объём материала, конечно, будет меньше, но зато определение будет достоверно на 99% и мусора постороннего не будет. Делать ещё одно подобие Яндекса или Гугла смысла нет, таких поисковиков и так дофига и больше.
Кстати, таким же образом можно будет отладить поиск любых других материалов - книг, статей, фильмов и т. д.

27.04.2016 20:11, Евгений Комаров

Ой, Иван! Нет в инете абсолютно достоверных. По любому всегда есть сомнения во многих случаях. Просто надо б.м. разбираться самому хотя бы в ограниченной таксономической группе, чтобы оценивать достоверность снимков в сети. Да и количество видов, уверенно определяемых по снимкам, весьма не велико по отношению к их общему числу.

27.04.2016 20:28, Петр Храмов

Как я и написал в стартпосте, п.3 — проблема с другими методами решения. Здесь задача побороть пп. 1 и 2, т.е. чтобы система правильно определяла, какой вид/таксон изображен по мнению загрузившего фото или автора сайта. А ошибаются они или нет она, ясное дело, не определит. Так что Иван мыслит в целом в правильном направлении (насчет ограничения сайтов для индексации).

27.04.2016 22:06, Иван Пристрем

Конечно, ни один сайт от ошибок не застрахован. У меня был случай, когда мою фотографию даже на ЗИНе неправильно переопределили, хотя изначально у меня определение было правильное. Но мой метод позволит свести количество ошибок и мусора к приемлемому минимуму.

27.04.2016 22:25, Иван Пристрем

Кстати, можно будет сделать так, чтобы ежели у какого вида не хватало фото с нашего сайта, то у него там же и ссылки на фото с других сайтов находились.
И, пожалуй, если в интернете среди иллюстраций к виду найдутся изображения класса "супер", то нужно будет постараться сделать так, чтобы они непременно попадали в самый верх подборки. Потому что такие фото, как, на пример, тут: http://www.zin.ru/animalia/coleoptera/rus/cicflams.htm , с моей точки зрения, должны быть видны всем в первую очередь.

28.04.2016 0:52, Юрий Семейкин

Иван ! А среди каких источников Вы собираетесь, что-то искать ? Прав Евгений, говоря, что их просто нет. Я разговаривал с энтомологами, так они говорят, что все сайты устарели, что давно не обновлялись (по бабочкам). Что очень немного сайтов, по которым можно как-то ориентироваться, но для этого надо знать с чем имеешь дело.....

28.04.2016 1:04, Петр Храмов

Повторяю. Рассматриваем проблемы в пп. 1 и 2. П. 3 не рассматриваем.

28.04.2016 6:31, Иван Пристрем

Источники фото? Diptera.info, Carabidae of the world, Атлас жуков России... Могу дальше перечислять. Их очень немало! А кроме больших сайтов, на которых десятки тысяч фото, есть ещё очень много некрупных, но тоже с хорошим материалом, типа http://coleop123.narod.ru и https://www.flickr.com/photos/coleoptera-us, там тоже точность определения составляет до 99% включительно. Хотелось бы очень макроид в эту подборку ввести, в нём очень много фото, но - там с определением полнейший бардак.

28.04.2016 18:14, Иван Пристрем

Нет, конечно, можно и макроид в список внести... Но только тогда кто-то должен будет в нем порядок навести на благо нашего сайта. Чтобы в нашем поисковике можно было увидеть фото с макроида, правильно определённые.

28.04.2016 18:21, Василий Феоктистов

Господа, вот здесь, на сайте находится тема по источникам, которые б.м. верные: https://insecta.pro/ru/community/2328
Создана она более пяти лет назад и периодически пополняется :)
Там уже много источников, инфа на которых верна и актуальна ("ручной отбор") :)
Если уж задумано городить свой собственный поиск по картинкам - то по тем ссылкам можно почерпнуть много чего полезного.
Оффтоп:
Пётр, кстати ту тему уже переименовывать пора: сайт ведь поменялся и уже неактуально: ""Аптечка" (разные полезные ссылки по бабочкам.".
Сейчас подойдёт: ""Аптечка" (разные полезные ссылки по насекомым." :)

28.04.2016 22:19, Петр Храмов

Василий, из той темы почерпываются источники даже для первой пробной версии поиска ;--)

15.05.2016 0:24, Петр Храмов

Господа, потестите предварительную версию поиска изображений: http://ist.insecta.pro
Сейчас пока ищет по ~750.000 фотографиям. Скоро добавим еще столько же.
Замечания:
1. Это не галерея. Это именно поиск по картинкам, которые хранятся на разных сайтах (в т.ч. и на Инсекте).
2. Сейчас ищет без дерева таксонов и без синонимов. Только по названиям, как они даны у фото. Т.е. нормально искать можно по подвидам, видам и родам.
3. При поиске вида нужно вводить название вместе с родом.
4. В выборке фотографий в правом нижнем углу у некоторых снимков будут значки — это пол особи/особей и знак вопроса, если определение под сомнением.
5. При клике на фоту она увеличивается, появляется дополнительная информаци о ней и ссылка, по которой вы можете перейти на страницу сайта, где она расположена.
6. При увеличении фот их можно листать с помощью стрелок или превьюх в нижней части экрана.
7. Обращайте внимание на количество результатов (в больших выборках они бьются по 30 шт. на страницу).
8. Кто с мобильного интернета — сейчас эта вещь довольно жрущая трафик, т.к. в пробной версии превьюхи на самом деле крупнее, чем они показаны на сайте.
Примеры корректных запросов в таксонах:
Papilio — покажет все виды и подвиды Papilio, а также фоты, которые определены до рода/подрода Papilio.
Papilio ma — покажет все, что начинается на Papilio ma, в т.ч. махаона.
Pap — покажет все, что начинается на Pap.
В географии можно вводить все, что угодно. В отличие от таксонов, там поиск идет не по маске Запрос*, а по маске *Запрос*. Кроме того, можно искать просто все фоты любых таксонов для данной местности (ввести запрос только в поле географии, но не таксона).
Пример: можно ввести в географии "нижегор", чтобы попытаться найти фоты интересующего вас таксона из Нижегородской области.

География указана не для всех снимков.
На первой странице будут работать автоподстановки, но ими необязательно пользоваться (в отличие от других полей на сайте). На странице с фотами автоподстановок не будет.

Жду ваших комментов, что понра, что не понра.

З.Ы. Проектом интересуются и спецы по другим группам (не только по насекомым), поэтому потихоньку добавляем и другие организмы в поиск.

15.05.2016 12:18, Шамиль Муртазин

Работает, география тоже. В выдаче попадаются и растения, и другие представители, раки например =) Ну я опять напомню о том, что всё вышенаписанное как подсказку надо куда-то на той же странице поиска разместить. Ибо нюансов много; и сам поиск занятие довольно "творческое" )
Мне бы ещё хотелось видеть ссылку на оригинальную страничку. Пока я туда попасть никак не могу. Видна только фотография.

15.05.2016 13:44, Петр Храмов

Да, раки там тоже есть, это нормально :--) Подсказку на странице поиска сделаем. Ссылка на оригиальную страницу есть в обязательном порядке под каждой фотографией (увеличиваем и смотрим описание внизу).
Да, еще одно. Где-то указано география на русском, где-то на английском, где-то на обоих. Учитывайте при поиске (особенно по зарубежным локациям).

15.05.2016 13:49, Петр Храмов

И еще. Напоминаю. Дерево таксонов сейчас пока игнорируется. Т.е. по запросу, например, трибы найдутся только фоты, которые определены до этой трибы, но не фоты всех дочерних таксонов трибы!

15.05.2016 15:13, Иван Пристрем

Хмммм... Это всё чрезвычайно интересно... Ничего подобного я ещё не видел. Поисковик уже на этом этапе показывает неплохие результаты, хотя и интерфейс пока недоработан. В перспективе стоит добавить следующие вещи:
- Возможность сортировки изображений по размеру, по источникам, по типу, по точности определения, по стадии/полу.
- Возможность менять определение фотографии в рамках нашего сервера (если окажется, что там, на сайте, определение неверное). То есть на том сайте оно останется прежним, а в поисковике у нас оно будет значится уже под истинным, с нашей точки зрения, определением.
- Возможность комментирования фото.
- Автоподстановку даты/времени (по данным с сайта либо по свойствам фото, причём в приоритете должна стоять датировка с сайта, потому что если это будет фото коллекционного экземпляра, сделанное зимой в камерных условиях, то, естественно, в свойствах фото будет обозначена дата создания файла, а не дата поимки насекомого.
- Возможность просмотра полноразмерного изображения, примерно как в Яндексе (после введения полноразмерного просмотра непосредственно на нашем сайте).

15.05.2016 15:29, Иван Пристрем

Ещё можно сюда же добавлять и вовсе неопределённые фото. Потому что иногда такие истории случаются... Недавно вот новый вид стрекозы описали. Обнаружили его случайно во время просмотра фильма. http://www.naturalis.nl/en/news/onderzoek/dragonfly-sir-david-90 . А самое интересное, что это - самая натуральная тамошняя банальщина, и в интернете уже масса её фото висела задолго до этого. Но их никто так и не заметил, потому что они размещены где попало, как попало, и, естественно, никто не пытался их определять, поэтому до них докопаться было почти нереально. Если же весь этот хаос упорядочить с помощью нашего поисковика, то найти новый вид по фото будет значительно проще.

15.05.2016 16:08, Иван Пристрем

Да. И ещё одна проблема: фотографии-клоны. Если автор фото выкладывал свои творения на два сайта и более, то в поисковике они отображаются все. Думаю, в будущем нужно будет сделать, как на яндексе - там все клоны автоматически группируются и в поисковике отображаются в единичном экземпляре. Только для этого потребуется специальная программа, которая будет эти клоны распознавать. И, возможно, более мощный сервер.

16.05.2016 7:02, Иван Пристрем

Я баг нашёл вот тут: https://insecta.pro/ru/is?cap=&geo=Бразилия
Там некоторые изображения не показываются, при попытке просмотра сайт выдаёт следующее: "The requested content cannot be loaded. Please try again later." При этом ссылки на источник рабочие. И, что самое интересное, все фото, которые cannot be loaded, с нашего сайта, с фотографиями из других сайтов всё нормально.

16.05.2016 15:38, Петр Храмов

Сортировка и отбор по этим параметрам будет, да.
Комментирование/определение тоже будет.
Дату/время робот собирает уже сейчас, но данных пока не так много, как по географии. Но тоже будем публиковать.
Сейчас примерно так и сделано, как на Яндексе. Если полноразмер еще больше — и Яндекс, и мы отсылаем к первоисточнику.
Неопределенные — да, в будущем можно, но это вопрос второстепенный по сравнению с точным сбором данных о том, что определено.
Про клоны — само собой, будем регулировать. Но это когда у нас на сайте будут хотя бы превью изображений (как на том же Яндексегугле). Сейчас мы не храним вообще никаких графических данных.
С глюком — знаю. Починим.

16.05.2016 18:28, Иван Пристрем

В Яндексе можно не только перейти на страницу с изображением, но и выйти на само изображение, а наш поисковик пока делает только первое. Добавить в будущем второе явно есть смысл - просматривать фото станет удобнее (особенно если в источнике фото зажаты в маленькие рамки при большом собственном размере, как в Carabidae of the World), или если требуется быстро просмотреть много фото с разных сайтов (для учёных чем быстрее и проще - тем лучше, т. к. время экономится). Тем более, что эта функция есть во всех топовых поисковиках. Точнее, она есть во всех известных мне поисковиках.

16.05.2016 19:40, Петр Храмов

Да, это сделать несложно.

19.05.2016 1:45, Петр Храмов

1. Поисковик переехал на новый адрес: http://ist.insecta.pro.
2. Появилась возможность отбора по стадии развития, по полу, по точности (но имейте ввиду, что значения соответствующих свойств указаны далеко не для всех фотографий).
3. В отборе по географии появилось второе поле. Теперь можно выбирать по принципу «или». Например, «екатеринбург» или «свердловск».
4. Обновленный интерфейс со всплывающими окошками и с помощью/справкой для каждого пункта, а также для страницы в целом (см. знаки вопроса в кружках).
5. В параметрах можно назначать свойство «включая неизвестное». Например, можно выбирать фотографии самцов И фотографии, для которых пол не указан, а можно выбирать ТОЛЬКО фотографии самцов.
6. Минимальная длина запроса и для названий таксонов, и для географии — 3 символа.
7. В отсутствие запроса на странице выводится случайная подборка фотографий.

19.05.2016 8:47, Иван Пристрем

То есть он у нас как бы отдельно от сайта будет?

19.05.2016 8:54, Иван Пристрем

Отбор не всегда работает. Поиск Cicindela campestris по названию вида и географии (ввёл свою область) - это прошло. А когда я попытался найти их парные фото - вылез пустой результат, хотя у меня две спаривающиеся пары есть и там отмечено, что это именно пары.

19.05.2016 11:04, Петр Храмов

То есть он у нас как бы отдельно от сайта будет?
Нет, все будет совмещено, просто временную версию для тестов правильнее будет делать пока независимой.

19.05.2016 11:15, Петр Храмов

По поводу парных фот и вообще указания пола — да, был глюк с отображением, сейчас исправил.

19.05.2016 16:54, Иван Пристрем

Я нашёл ещё один зверский баг. По запросу Phlebodes confixa вся подборка просто пустая, без фото. Я думаю, тут нужно совершенствовать саму программу, которая изображения индексирует.

19.05.2016 17:47, Петр Храмов

Да, на сайте, где расположены эти фоты, на часть из фот ведут кривые ссылки. Т.е. сам сайт, видимо, не в курсе, что они кривые. И робот еще не умеет такое определять. Но научим постепенно.
З.Ы. А настолько явная проблема — оттого, что мы пока не храним превьюхи. Но это временно. В стандартном режиме работа будет аналогичной яндексу/гуглу — превьюхи храним у себя, за полноразмером шлем на сайт.

19.05.2016 19:55, Петр Храмов

Исправлен глюк, когда фоты с инсекты, у которых не было крупной версии (только 320) не отображались в поиске.

22.05.2016 2:25, Петр Храмов

1. На данный момент проиндексировано и доступно для поиска ~2.400.000 фотографий.
2. Искать теперь можно не только по полному названию, но и по краткому (будет работать и Papilio machaon, и machaon).
3. Вывод превьюх стал несколько меньше по весу.

Деревья скоро тоже подключим (пока только для насекомых).

22.05.2016 12:18, Александр Белоусов

Попробовал поиск. Найдено 28 изображений, но картинок всего 10 показывает. Как ни старался. Хотя когда обновляю страницу, выскакивают картинки и другие, но потом гаснут. А сами картинки должны быть активными? При клике на них ничего не происходит. (браузер Opera).

22.05.2016 14:24, Петр Храмов

Александр, ссылку сбросьте на результаты поиска, посмотрю, что не так. Должны показываться все 28 и, само собой, все должны быть активными.

22.05.2016 17:34, Александр Белоусов

http://ist.insecta.pro/?cap=Aporia+leucodice&geof=&geos=

22.05.2016 18:21, Петр Храмов

Оченно странно. Попробовал и в Опере, и не в Опере, все норм открывается. Есть возможность попробовать то же самое в Опере в режиме Турбо и в каком-нить альтернативном браузере?

22.05.2016 18:30, Шамиль Муртазин

У меня всё работает. Файерфокс.

22.05.2016 18:45, Петр Храмов

Я уже даже через Вивальди попробовал :--)

22.05.2016 18:57, Шамиль Муртазин

Александр, попробуйте другой браузер и/или переустановите/обновите свой. Скорее всего, именно в ПО "собака порылась" =)

23.05.2016 1:05, Петр Храмов

Добавлено дерево (с Инсекты). Теперь, если вводим запрос "Papilionidae", будут выведены не только фото, бабочки на которых определны до этого семейства, но и фоты с бабочками всех дочерних таксонов (из тех, что есть в дереве). Коль скоро дерево с Инсекты, то и работает оно только для насекомых. Пробовать дерево можно от уровня отряда и ниже.
Добавлено несколько тысяч английских и русских названий, по которым теперь тоже можно искать.

30.05.2016 7:22, Иван Пристрем

Я обнаружил какие-то непонятные вкрапления. Запрос - Hesperiidae, вторая страница.

30.05.2016 7:24, Иван Пристрем

А, всё, я понял. Там на сайте не только фото приведены, но и сканы книги и карты с местами находок.

30.05.2016 12:53, Петр Храмов

Так и есть. Робот не знает, фота это экземпляра или первоописания или еще чего.

30.05.2016 16:22, Иван Пристрем

В далёком (или не очень далёком) будущем было бы неплохо научить его текст с картинки распознавать.

30.05.2016 16:57, Петр Храмов

Зачем? В подавляющим большинстве случаев полезная часть текста будет дублироваться в явном виде на той же странице.

03.06.2016 6:33, Иван Пристрем

Ну... Я думаю, в будущем, когда появится аналогичный поисковик по документам, такие фото нужно будет помещать туда, это ведь эксклюзивный материал, все учёные за первоописаниями гоняются, сломя головы.

03.06.2016 7:00, Юрий Семейкин

Да никто ни за чем не гоняется. Сейчас голотип можно через инет переслать. Это раньше использовали почту , либо ездили сами.

07.06.2016 10:02, Иван Пристрем

Ну тогда ладно.

07.06.2016 15:53, Петр Храмов

А тексты-то здесь причем?.. Не догоняю...

Новый комментарий

Зарегистрируйтесь на сайте и/или зайдите в свой аккаунт, чтобы загружать новые сообщения и комментарии.

* По умолчанию переводом комментариев c русского на английский занимается администрация сайта. Если вы хотите по максимуму сохранить авторский стиль либо просто облегчить жизнь переводчику — скопируйте текст вместе с тегами из окна с русским комментарием, вставьте его в окно английского и замените русский текст на английский, сохранив теги.

Случайные виды насекомых из каталога сайта

Insecta.pro: международный энтомологический портал. Условия использования и публикации материалов.

Редактор и администратор проекта: Петр Храмов.

Кураторы: Константин Ефетов, Александр Жаков, Святослав Князев, Евгений Комаров, Станислав Корб, Василий Феоктистов.

Модераторы: Александр Жаков, Евгений Комаров, Дмитрий Пожогин, Василий Феоктистов.

Спасибо всем авторам, публикующим свои материалы на сайте.

© Каталог насекомых мира Insecta.pro, 2007—2024.

Каталог видов с возможностью отбора по признакам (география, время лёта и др.).

Фотогалерея с изображениями представителей Insecta.

Подробная классификация насекомых с переченем основных источников.

Несколько тематических статей и регулярно пополняемый блог.