天蚕在你身边
不方便打电话?让天蚕联络你
网页表示模型包含这样几项信息元素:网页标识、网页类型、内容类别、标题、关键词、摘要、正文、相关链接。
网页类型是根据网页内容的表现形式进行划分的,网页可分为三类:有主题网页(topic)、图片网页(pic)、Hub网页(hub)。
为什么将网页分为上述三个类型呢?是因为三类网页在用途和处理方法上存在较大的差别。
其中 Hub网页与其它两类网页的区别在于网页在Web上发挥的作用不同,Hub网页通常不会具体的讲述一件事物,而是提供关于相关信息的链接集。而图片网页与 其它两类网页的区别在于处理的方法不同,由于图片网页的内容是通过图片表达的而不是通过文字,因而,传统信息处理领域的方法对图片网页是不够有效的。三类 网页间的区别导致很多应用领域都会对它们作适当的区别。
内容类别是从语义上对网页的内容进行分类,它是搜索引擎获取网页语义信息的一个直接手段,在Web上的研究领域中有着广泛的使用。它是通过特定的分类器对网页内容分类得到的,依赖于一定的分类体系
重庆网络公司
地址:重庆市渝中区上清寺鑫隆达B座28-8
邮编:400015
电话:023-63612462
EMAIL:cnjl_net@163.com