Простой пример выше позволяет понять логику классификации и технические моменты. Теперь попытаемся рассмотреть более жизненный пример. Жизненной будет ситуация, в то время как технологически для лучшего понимания существенного далее все же будет сделан ряд допущений и технических упрощений.
В статье рассматривалось заведение в БД и индексирование «картотеки» с краткими описаниями новостей, полученных из канала RSS в интернете для Oracle Technology Network, и со ссылками на источник. Возьмем одну такую ссылку:
CTX> COLUMN link FORMAT A75 CTX> SELECT link FROM otnnews WHERE ROWNUM = 1;
LINK --------------------------------------------------------------------------- http://www.oracle.com/technology/pub/articles/hunter_rac10gr2_iscsi.html?rs sid=rss_otn_news
Вот начало документа HTML, расположенного по этой ссылке:
Проделаем следующее: