《Mining the Web:Transforming Customer Data into Customer Value》

《Web数据挖掘:将客户数据转化为客户价值》

——[美] Gordon S.Linoff Michael J.A. Berry 著

【数据挖掘的角色】

数据挖掘的角色就是在和客户的联系中加入智能——并且通过调节人的智能来更精确地做到这一点。

数据挖掘的目标就是利用信息系统重新加入人的调节,使得商家能更好地了解客户的需求,同时也使得经济规模达到价格更低廉和选择更多。

【数据挖掘的方法】

Web数据挖掘一般指的是三种完全不同的行为,所有的这些行为都有数据挖掘的特性并且都被包括在网络中,但是就像数据挖掘的动机不同一样,实际被挖掘的数据也是不同的。

这三种行为即为:

1、  结构挖掘

结构挖掘是用来提取网络的拓扑信息的——网页之间的链接信息。哪些页面被其他页面所链接,哪些页面指向了其他页面?哪些页面的集合构成了一个独立的整体?

2、  应用挖掘

应用挖掘是用来提取关于客户如何运用浏览器浏览和使用这些链接的信息。他们访问了哪些页面?在每一页上待了多长时间?下一步单击了什么?在站点中是按照怎样的访问路线通向检查计数器,又是通过怎么样的路线直接退出的?

3、  内容挖掘

内容挖掘是用来提取文字、图片或其他组成网页内容成分的信息。哪个站点卖辣酱?哪些页面是德文的?哪些页面是介绍莫里斯的舞蹈,或是介绍酸雨的?搜索引擎、智能代理和一些推荐引擎都使用内容挖掘来帮助客户在浩瀚的网络空间中寻找需要的内容。

【结构挖掘中的“计算引用”】

在“不是出版,就是毁灭”的学术世界里,引用一直是保持成绩的一个方法。仅仅是出版过文章是不够的, 重要的是其他人的确读过它并且觉得它们有用。一篇文章的有用与否在于这篇文章出现在在其他文章的参考书目中的次数。特别是作者,会因为他的作品的重复引用而在某个学科出名。——!!!

【不同的搜索引擎决定什么页面能够吸引读者的方式有关】

AltaVista 是基于内容挖掘的,而Google同时还使用了结构挖掘。一言以蔽之,当一个客户输入要搜索的字串“数据挖掘查询”,AltaVista 将很高兴地返回任何谈到数据挖掘查询的页面,而Google则根据对于有关该题目链接的页面的结构的分析来返回它认为是权威的页面。

《Mining the Web:Transforming Customer Data into Customer Value》读后札记的更多相关文章

  1. 《编写高质量代码——Web前端开发修炼之道》读后随笔

    结构样式行为的分离 结构标准包括XML标准.XHTML标准.HTML标准:样式标准有CSS标准:行为标准主要包括DOM标准和ECMAScript标准. 通常的项目会按照如上的方式进行分离,但自己曾今做 ...

  2. 自开发Web应用和SAP Customer Data Cloud Identity服务的集成

    今天的文章继续由SAP成都研究院的云时代女王,Aviva给大家分享关于SAP Customer Data Cloud的一些使用经验. Aviva之前的文章可以在本文末尾处获得. 下面是她的正文. 大家 ...

  3. data Mining with Weka: Trailer More Data Mining with Weka 用weka 进行数据挖掘 Weka 用weka 进行更多数据挖掘

    https://www.youtube.com/user/WekaMOOC 大学公开课  视频教程 weka 入门教程 data Mining with Weka: Trailer  More Dat ...

  4. 扩展银行项目,添加一个(客户类)Customer类。Customer类将包含一个Account对象。

    练习目标-使用引用类型的成员变量:在本练习中,将扩展银行项目,添加一个(客户类)Customer类.Customer类将包含一个Account对象. 任务 在banking包下的创建Customer类 ...

  5. Web.config中加了system.diagnostics节点后就不能访问了

    Web.config中加了system.diagnostics节点后就不能访问了,怎么回事? [解决方法] 不要把system.diagnostics节点作为web.config的第一个节点.

  6. jmeter 通过csv data set config 设置参数化后,执行结果显示为<EOF>

    通过csv data set config 设置参数化后,执行结果显示为<EOF>: 反复确认相应的参数的设置均没有问题,其中csv文件编码方式采用uft-8.在csv data set ...

  7. SAP Customer Data Cloud(Gigya)的用户搜索实现

    我在Gigya前台根据email搜索,输入一个邮箱地址,回车,在Chrome开发者工具里观察到到后台的网络请求: 这是一个post请求: __RequestVerificationToken 请求体: ...

  8. 练习2 练习目标-使用引用类型的成员变量:在本练习中,将扩展银行项目,添加一个(客户类)Customer类。Customer类将包含一个Account对象。

    package banking; public class Customer { private String firstName; private String lastName; private ...

  9. C# Web 数据注解Data Annotations、模型状态ModelState、数据验证

    C#中的模型状态与数据注解,为我们提供了很便利的请求数据的验证. 1. ModelState ModelState在进行数据验证的时候很有用的,它是: 1)验证数据,以及保存数据对应的错误信息. 2) ...

随机推荐

  1. 使用moneykey对APP进行健壮性测试

    注意:moneykey对app按钮伪随机点击,只能测试app稳定性和健壮性,无法进行常规测试 1.安装 A.jdk(不详细介绍) B.安装配置android配置环境:Android Studio 此环 ...

  2. 微信token

    <?php define("TOKEN", "lmaster"); function checkSignature() { //从GET参数中读取三个字段 ...

  3. Hive知识

    HIVEQL CREATE DATABASE financials(创建数据库) SHOW DATABASES(显示数据库) SHOW TABLES IN 数据库(列出数据库的所有表) SHOW DA ...

  4. Codeforces 856B - Similar Words

    856B - Similar Words 题意 如果一个字符串可以通过去掉首位字母得到另一个字符串,则称两个字符串相似. 给出一个字符串集合,求一个新的字符串集合,满足新集合里的字符串是原字符串集合中 ...

  5. hdu6158(圆的反演)

    hdu6158 题意 初始有两个圆,按照标号去放圆,问放完 \(n\) 个圆后的总面积. 分析 圆的反演的应用. 参考blog 设反演圆心为 \(O\) 和反演半径 \(R\) 圆的反演的定义: 已知 ...

  6. Codeforces 785E Anton and Permutation(分块)

    [题目链接] http://codeforces.com/contest/785/problem/E [题目大意] 一个1到n顺序排列的数列,每次选择两个位置的数进行交换,求交换后的数列的逆序对数 [ ...

  7. 【贪心】Codeforces Round #401 (Div. 2) D. Cloud of Hashtags

    从后向前枚举字符串,然后从左向右枚举位. 如果该串的某位比之前的串的该位小,那么将之前的那串截断. 如果该串的某位比之前的串的该位大,那么之前那串可以直接保留全长度. 具体看代码. #include& ...

  8. 【动态规划】Gym - 101147H - Commandos

    裸dp,看代码. #include<cstdio> #include<algorithm> #include<cstring> using namespace st ...

  9. 3.3常用类(java学习笔记)Runtime与Process

    一.Runtime 我们来看下文档中对Runtime的说明: 每一个java程序都有一个属于Runtime类的实例,它允许程序连接到程序运行环境. 当前runtime可以用getRuntime()方法 ...

  10. tcp状态-TIME_WAIT与CLOSE_WAIT带来的坑

    tcp状态: http://www.cnblogs.com/DengGao/p/tcp_state.html 1. tcp连接会占用系统资源(文件描述符), 有时候甚至会导致系统假死(不能发起或者处理 ...