为什么网站的内容概述跟以往的有别?
因为现时「网站」的搜索结果是由yahoo引擎自动在互联网上找来的,所以内容概述也是由引擎自动在网站内抽取的。
例如,你输入“kobe”一字,现在你能看到的内容概述大概是这样:
例一:含神户(kobe)的简介及交通资讯,并介绍北野、风见鸡之馆及萌黄之馆等…
例二:有关美国职篮球员iverson、kobe bryant、jordan等及NBA资料…
这些其实是yahoo美国搜索引擎从网站中抽取符合关键字“kobe”的一些资料,并没有经过人手编辑整理,所以跟以往常看到的有别。但从这内容概述中,你可以得到更多关于这些网站的资料。
例如,你从例一的内容概述中可见,网站的内容是关于日本的神户。若你想搜索篮球员Kobe Bryant的资料,那该网站便不符合你的要求。相反,若你想搜索「神户」的资料,那例二便不适合了。由此可见,新的内容概述能助你更快更准确地寻找合适的网站。不过,有些网站却没有任何内容概述,这是由于yahoo美国搜索引擎在网站的原始档内只找到一些电脑编码,因而抽取不到可辨认的文字。
为什么查询的网页无法连结?
当点进一个网页,却出现「无法显示网页」或是「Document Not Found」,当你看到这些讯息,可能是因为以下原因:
网站伺服器太过繁忙,或是因为网站维修而暂时停止提供服务
网站可能必须有许可才能进入,如果一定要连上这个网站,请和网站负责人联系。
该网页可能已经不存在了,请你通知我们,我们会尽快将网页从资料库中移除。
如何避免我的网页被存到「网页纪录」?
yahoo搜索引擎在网络上发现相关资料的时候,会把多数网页储存;这使我们能够显示出搜索相关页面的资讯,并且若该网站的的伺服器临时无法连结,网友仍可藉由「网页纪录」读取相关资讯。
如果你的网站内容不想被存到「网页纪录」,你可使用NOARCHIVE的标签指令。
在你的HTML编辑语法中,在...的部分写下以下指令︰
这个标签会告诉yahoo搜索引擎不要将你的网页抓取并储存在「网页纪录」,但你的网站仍会被搜索引擎收录在搜索结果中,只是不会显示「网页纪录」。
请注意,在你加了NOARCHIVE标签指令之后,需等到yahoo搜索引擎再次抓取你的网页,侦测到NOARCHIVE标签指令时才会生效。
NOARCHIVE标签只控制「网页纪录」的显示,如果你不希望你的网站被搜索引擎收录于yahoo美国搜索结果,请使用NOINDEX。
什么是yahoo影片搜索?
随着个人视讯影片热门度的增加,yahoo提供影片搜索服务,让你可以在我们的资料库中找到互联网上的影片。你更可以用“加入你的影片”的功能,把影片免费加入雅虎的资料库(雅虎只会储存影片的连结),让其他网友可以看到影片。
点击搜索结果中的影片来源网址后会怎样?
在yahoo美国搜索结果中点击影片来源网址,你便会在新视窗看到影片的详细资料。视窗下方还可看到使用该影片的网页预览。
其他连结及功能
播放影片:会看到原本的影片
来源网址:跳到使用该影片的网页
搜索资料库如何搜集资料、分析资料?
首先搜索系统会建立一个网页地图(Webmap),再使用网页抓取程式(Robot)根据网页地图来抓取(Crawl)网页,储存到搜索资料库中。接下来我们会利用「索引技术(Index)」将资料做编号储存,同时搜索技术也会利用一些技术将不相关的网站除去。