Методы интернет-поиска могут радикально изменить навигацию по патентным базам

e2f117c2ec6d3b28e2b0328a8734c2c2_resized_width_c1bdc981a0a3cb6def62e52e2fa2bc79_500_q95.jpg

Помнящие, каково было искать в Интернете в первой половине девяностых, согласятся: информация ничто, если её нельзя найти. Шок вызывало понимание того, что на вроде бы однозначный запрос ненужное «находилось» «на раз», а вот то самое — никак. О каких-нибудь приличных материалах по высшей математике можно было даже не задумываться: найти их «в лоб» всё равно не получалось. Впрочем, так было не очень долго...

Увы, если Интернет слегка эволюционировал, то с патентной системой мы всё ещё в 1995 году. Да что там, 1994-й будет честнее... Лабиринт, зачастую без «лишних шуточек» вроде системы, смысла и логики, как знает любой, потративший несколько часов на поиск в патентных базах.
Нет, там, конечно, тоже есть директории и прочие атрибуты тёплого (от жара зухелевского модема) Интернета на 14 400 бод. Но до быстрого поиска по смыслу всё ещё очень далеко.

Лучано Кей (Luciano Kay) из Калифорнийского университета в Санта-Барбаре (США) пытается повторить революцию веб-поиска в патентной отрасли. Как некогда Джон Клейнберг (Jon Kleinberg) из Корнеллского университета (США), он посчитал, что связи между отдельными патентами (сайтами) говорят о значимости и содержании патентов часто больше, чем содержимое, которое автоматически анализировать всё равно придётся по словам, а не по их сути.

В разработке г-на Кея каждый патент — это узел сети, а попросту говоря, подключённое к ней устройство. Линку между двумя узлами приравняли ссылку одного патента на другой. После этого все сферы («директории») были связаны между собой такими линками, что позволило количественно определить технологическую дистанцию между любыми двумя областями. Если ссылок в одной группе патентов на другую мало, то связь между областями слабее, и наоборот.

Для тестирования своего подхода исследователи взяли все патенты 2000–2006 годов в Европейском патентном офисе и создали программу для визуализации связей. Она, правда, пока в стадии отладки, но всё же...

Для демонстрации возможностей нового подхода Лучано Кей и компания разместили на патентной карте нынешних патентных монстров — тех же Samsung, DuPont и IBM, а также те новые технологии, что связаны с графеном, нано- и биосенсорами (и так далее).

Дело не только в том, что на такой карте секция, скажем, A (человеческие потребности) оказалась временами весьма близка к секции, к примеру, С (химия и металлургия), но и в том, что в местах максимальной плотности связей можно отыскать самые быстроразвивающиеся области, а, напротив, в «пустотах» — наиболее медленно эволюционирующие.

Что ж, как бы сильно это ни выглядело, перед нами лишь начало пути. Многие легко вспомнят, что вслед за пониманием роли линков интернет-поиск был революционизирован Pagerank'ом — с учётом того, как часто действительно важные веб-странички ссылались на другие немаловажные.

В принципе, нет никаких причин, по которым такой принцип не может быть внедрён патентоведами: в конечном счёте, это потребует лишь длительного ручного труда вначале для определения самых значимых изобретений в каждой области. Очевидно, что внедрение вот такого аналога Pagerank наконец-то позволит добиться от поиска действительно прорывных идей достойной результативности.

Препринт доступен на сайте arXiv (1208.4380).

По материалам Technology Review.