驱家通行证
 
联系我们 | 镜像合作
 
首页 | 资讯 视点 评测 | 产品体验 | 驱动中心 更新 搜索 分类 查询向导 订阅向导 驱动精灵 | 移动之家 硬件工具 | 社区 | 手机版
blog版本
文章索引
显卡、CPU、主板 常用配件 移动办公 网络相关 数码设备 外部设备 游戏相关 操作系统 软件驱动 业界信息
当前位置 > 新闻中心 > 网络相关
关键字 搜索

Googlebot开始检索网站深层内容

驱动之家[原创] 作者:Alright 编辑:Alright 2008-04-13 13:31:52 Loading [投递]

Google公司今天宣布,其Googlebot web信息采集系统将开始自动填写HTML表单,并记录反馈结果。

Google搜索引擎似乎在不顾一切的吞食来自互联网的数据,仅去年1年它就吞下了约100 Exabytes(1 Exabyte=1000000000 Gigabyte)的数据。之前Google并不触及大量的深层页面(也就是网站中被隐藏的内容,例如没有连接的页面,非文本的内容,或是动态内容返回的结果),但是从今天开始,Google将开始对这些页面进行检索。

据Google表示“对于文本框,我们的电脑会自动对网站上的表格进行填写,并会选择菜单,复选框,以及相应的按钮,然后索引有价值的HTML结果。”Google指出,对于动态表格所反馈的结果并不影响对网站的普通检索,排名或是其他的内容。并且Googlebot绝对会遵守robots.txt的规定不对禁止访问机器人访问的页面进行检索。

据估计,目前互联网上的深层页面要比目前公布的页面大几个数量级。而且有人指出,Google永远也不能把互联网上的所有内容都检索到,其Googlebot的爬行结果对于整个互联网来说只是管中窥豹。不过Google表示,对深层页面的索引只是为了找出更多动态页面之间的联系,而不仅仅是为了索引结果。

相关文章
· Google健康开放测试 (05-21)
· Google图像搜索将整合广告 (05-20)
· Google创始人青睐雅虎杨致远 (05-20)
· 骑车环绕Google Earth (05-20)
· Google推出Web开发百科全书Doctype (05-16)
· Google翻译新增10种语言 支持自动.. (05-16)
一周热点文章
· 暴雪正式宣布《Diablo III》 (06-28)
· 功耗还是性能?Phenom X4 9350e/9950.. (07-01)
· 《暗黑破坏神3》最新截图22张 (07-01)
· 《Diablo III》游戏截图、视频、壁纸 (06-28)
· Radeon HD 4800支持100%光线追踪管线 (06-27)
· Core 2 Duo E8400 Ubuntu性能全方位考.. (07-03)
新闻浏览导航
Atom核心工人舍UMPC发布
Atom芯Eee PC 901拆解


C
P
U
· 厂商回应固态硬盘耗电说
· 日立:2010年发售5TB硬盘
· HD 4800、9600 GT用双风扇散热器
行情信息
· NVIDIA笔记本芯片瑕疵探究
· GeForce 9800 GTX+未上市先降价10美元
· 低端新军:55nm GeForce 9500 GT规格.
操作系统
· AMD OverDrive将支持790GX、SB750超频
· 下载:Nikon Camera Control Pro遥控.
· 下载:诺基亚手机PC Suite套件7.0官方.
人机扑克大赛拉斯维加斯开战
下载:诺基亚手机PC套件7.0官方正式版
软件驱动
· eBay放弃Paypal支付垄断计划
· 人机扑克大赛拉斯维加斯开战
· 微软Silverlight专利官司上身
数码设备
· 50000:1对比度 宏碁G24液晶发布
· 宽屏液晶向16:9迈进 趋势不可逆转
· Razer发布中国专用游戏键盘:橘仓金蛛
游戏相关
· 微软用iPod当奖品
· Ubuntu 8.04.1发布
· 戴尔苹果风格工具栏由Stardock制造
一周新闻热点回顾