《Mining the Web:Transforming Customer Data into Customer Value》读后札记
《Mining the Web:Transforming Customer Data into Customer Value》
《Web数据挖掘:将客户数据转化为客户价值》
——[美] Gordon S.Linoff Michael J.A. Berry 著
【数据挖掘的角色】
数据挖掘的角色就是在和客户的联系中加入智能——并且通过调节人的智能来更精确地做到这一点。
数据挖掘的目标就是利用信息系统重新加入人的调节,使得商家能更好地了解客户的需求,同时也使得经济规模达到价格更低廉和选择更多。
【数据挖掘的方法】
Web数据挖掘一般指的是三种完全不同的行为,所有的这些行为都有数据挖掘的特性并且都被包括在网络中,但是就像数据挖掘的动机不同一样,实际被挖掘的数据也是不同的。
这三种行为即为:
1、 结构挖掘
结构挖掘是用来提取网络的拓扑信息的——网页之间的链接信息。哪些页面被其他页面所链接,哪些页面指向了其他页面?哪些页面的集合构成了一个独立的整体?
2、 应用挖掘
应用挖掘是用来提取关于客户如何运用浏览器浏览和使用这些链接的信息。他们访问了哪些页面?在每一页上待了多长时间?下一步单击了什么?在站点中是按照怎样的访问路线通向检查计数器,又是通过怎么样的路线直接退出的?
3、 内容挖掘
内容挖掘是用来提取文字、图片或其他组成网页内容成分的信息。哪个站点卖辣酱?哪些页面是德文的?哪些页面是介绍莫里斯的舞蹈,或是介绍酸雨的?搜索引擎、智能代理和一些推荐引擎都使用内容挖掘来帮助客户在浩瀚的网络空间中寻找需要的内容。
【结构挖掘中的“计算引用”】
在“不是出版,就是毁灭”的学术世界里,引用一直是保持成绩的一个方法。仅仅是出版过文章是不够的, 重要的是其他人的确读过它并且觉得它们有用。一篇文章的有用与否在于这篇文章出现在在其他文章的参考书目中的次数。特别是作者,会因为他的作品的重复引用而在某个学科出名。——!!!
【不同的搜索引擎决定什么页面能够吸引读者的方式有关】
AltaVista 是基于内容挖掘的,而Google同时还使用了结构挖掘。一言以蔽之,当一个客户输入要搜索的字串“数据挖掘查询”,AltaVista 将很高兴地返回任何谈到数据挖掘查询的页面,而Google则根据对于有关该题目链接的页面的结构的分析来返回它认为是权威的页面。
《Mining the Web:Transforming Customer Data into Customer Value》读后札记的更多相关文章
- 《编写高质量代码——Web前端开发修炼之道》读后随笔
		
结构样式行为的分离 结构标准包括XML标准.XHTML标准.HTML标准:样式标准有CSS标准:行为标准主要包括DOM标准和ECMAScript标准. 通常的项目会按照如上的方式进行分离,但自己曾今做 ...
 - 自开发Web应用和SAP Customer Data Cloud Identity服务的集成
		
今天的文章继续由SAP成都研究院的云时代女王,Aviva给大家分享关于SAP Customer Data Cloud的一些使用经验. Aviva之前的文章可以在本文末尾处获得. 下面是她的正文. 大家 ...
 - data Mining with Weka: Trailer  More Data Mining with Weka 用weka 进行数据挖掘  Weka 用weka 进行更多数据挖掘
		
https://www.youtube.com/user/WekaMOOC 大学公开课 视频教程 weka 入门教程 data Mining with Weka: Trailer More Dat ...
 - 扩展银行项目,添加一个(客户类)Customer类。Customer类将包含一个Account对象。
		
练习目标-使用引用类型的成员变量:在本练习中,将扩展银行项目,添加一个(客户类)Customer类.Customer类将包含一个Account对象. 任务 在banking包下的创建Customer类 ...
 - Web.config中加了system.diagnostics节点后就不能访问了
		
Web.config中加了system.diagnostics节点后就不能访问了,怎么回事? [解决方法] 不要把system.diagnostics节点作为web.config的第一个节点.
 - jmeter 通过csv data set config 设置参数化后,执行结果显示为<EOF>
		
通过csv data set config 设置参数化后,执行结果显示为<EOF>: 反复确认相应的参数的设置均没有问题,其中csv文件编码方式采用uft-8.在csv data set ...
 - SAP Customer Data Cloud(Gigya)的用户搜索实现
		
我在Gigya前台根据email搜索,输入一个邮箱地址,回车,在Chrome开发者工具里观察到到后台的网络请求: 这是一个post请求: __RequestVerificationToken 请求体: ...
 - 练习2  练习目标-使用引用类型的成员变量:在本练习中,将扩展银行项目,添加一个(客户类)Customer类。Customer类将包含一个Account对象。
		
package banking; public class Customer { private String firstName; private String lastName; private ...
 - C# Web 数据注解Data Annotations、模型状态ModelState、数据验证
		
C#中的模型状态与数据注解,为我们提供了很便利的请求数据的验证. 1. ModelState ModelState在进行数据验证的时候很有用的,它是: 1)验证数据,以及保存数据对应的错误信息. 2) ...
 
随机推荐
- shell脚本学习(二)
			
shell传递参数 shell脚本在执行是可以传递参数,脚本内获取参数的格式为:$n,n为一个数字,1为第一个参数,2为第二个参数,以此类推 其中,$0代表了要执行的文件名 实例: 代码如下: #!/ ...
 - (1)java版本
			
jdk9新增 jshell工具, 类似python的命令行界面.
 - noi题库 1.7 字符串
			
前九题 01:统计数字字符个数 总时间限制: 1000ms 内存限制: 65536kB 描述 输入一行字符,统计出其中数字字符的个数. 输入 一行字符串,总长度不超过255. 输出 输出为1行,输出字 ...
 - 19、Flask实战第19天:CSRF攻击与防御
			
CSRF攻击原理 网站是通过cookie来实现登录功能的.而cookie只要存在浏览器中,那么浏览器在访问这个cookie的服务器的时候,就会自动的携带cookie信息到服务器上去.那么这时候就存在一 ...
 - 【Android】 HttpClient 发送REST请求
			
直接po代码吧,第一个是一个枚举类型的类,是四种rest http请求,get/post/put/delete: public enum HttpRequestMethod { HttpGet { @ ...
 - 通用数据库管理工具DBeaver
			
通用数据库管理工具DBeaver 在渗透测试中,用户往往需要管理很多数据库.这些数据库可能是渗透软件使用的(如Metasploit使用的Postgresql),也有目标主机的数据库(如网站的数据库 ...
 - 【动态规划】bzoj3992 [Sdoi2015]序列统计 10分
			
#include<cstdio> using namespace std; #define MOD 1004535809 int a[8001],f[1001][101],n,m,x,S; ...
 - linux-排序-sort
			
命令格式: sort [参数][源文件][-o 输出文件] 参数: -b 忽略每行前面开始出的空格字符. -c 检查文件是否已经按照顺序排序. -f 排序时,忽略大小写字母. -M ...
 - mq
			
同时每个 Broker 与NameServer 集群中的所有节点建立长连接,定时注册 Topic 信息到所有 NameServer 中. Producer 与 NameServer 集群中的其中一个节 ...
 - 微信开发之消息接收与回复--weixin-java-tools
			
一.前言 在上一篇文章<微信开发之如何使用开发工具--weixin-java-tools>中我给各位介绍了weixin-java-tools,并且介绍了如何使用weixin-java-to ...