·背景 前一阵,一直在研究一些ML的东东,后来工作关系暂停了一阵.现在继续把剩下一些热门的算法再吃吃透,"无聊+逗比"地把他们搞到MapReduce上.这次选择的入手对象为Apriori,也就是大家俗称的"关联规则挖掘",有别于CF(协同过滤)的正交输出.再俗一点,就是常被人提及的"啤酒+面包"的故事. ·Apriori算法简介 在关联规则挖掘方面,有两项著名的算法:Apriori和FPgrowth.两者各有特点,由于计算量级别的差异,越来越多的…
背景: 在所有聚类算法中KMeans算是表面上最简单的一种,没有过多恼人的古希腊符号公式,没有过分繁杂的公式嵌套.对于一个初学矩阵或者仅有向量概念的非专业人士的来说,不可不畏是一把踹门利器.这个世界上越是简单的东西,其实越是复杂,尤其在笔者将其改造成MapReduce时,发现并非那么容易一跃而过.虽然有现成的代码供把玩,但是对于练手还是值得一试. 心得: · 纯理论一笔带过 KMean的大致实现过程就是任意指定N个的质心,然后对所有星星进行遍历,寻找与这个N个质心距离最近欧几里得距离的星星,将其…
最近开始使用上github来上传保存自己在学习中所写过的代码,打算将自己每天的成果能有个保存,然后就利用上GitHub这么一个利器. 听说GitHub的那个绿块是用来记录每天的上传记录的,结果我将代码上传之后,却发现除了前几次之外,后面每次上传之后,明明在代码区已经可以找到自己的成果,但是绿块却并没有变色.虽说使用github的主要目的不是为了只要刷上传量,但这就好像是自己辛苦工作一天,却不能打卡签到一样,总是会有一点介意的. 然后参考了一下网上的文章,又自己刷了一遍关于GitHub使用的教学视…
使用wepy开发微信小程序商城第一篇:项目初始化 使用wepy开发微信小程序商城第二篇:路由配置和页面结构 列表页效果图: 1.新建列表页 (1)在pages里面新建一个list.wpy文件 初始代码结构如下: <style lang="less"> </style> <template> <view> </view> </template> <script> import wepy from 'wep…
Apiroi算法在Hadoop MapReduce上的实现 输入格式: 一行为一个Bucket 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 1 3 5 7 9 12 13 15 17 19 21 23 25 27 29 31 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68…
记录近期换工作时遇到的面试题和面试题答案 css 部分 盒模型 问题:说一下 css 的盒模型 盒模型分为标准模型和怪异盒模型(IE 盒模型) 标准盒模型:盒模型的宽高只是内容(content)的宽高 怪异盒模型:盒模型的宽高是内容(content)+填充(padding)+边框(border)的总宽高 问题:css 如何设置两种模型 /* 标准模型 */ box-sizing:content-box; /*IE模型*/ box-sizing:border-box; 问题:有没有遇到过边距重叠,…
小Q系列故事——世界上最遥远的距离 Time Limit: 500/200 MS (Java/Others)    Memory Limit: 65535/32768 K (Java/Others)Total Submission(s): 1751    Accepted Submission(s): 628 Problem Description 世界上最遥远的距离 不是生与死 而是我就站在你面前 你却不知道我爱你 世界上最遥远的距离 不是我就站在你面前你却不知道我爱你 而是明明知道彼此相爱…
小Q系列故事——世界上最遥远的距离 Time Limit: 500/200 MS (Java/Others)    Memory Limit: 65535/32768 K (Java/Others) Total Submission(s): 1399    Accepted Submission(s): 501 Problem Description 世界上最遥远的距离 不是生与死 而是我就站在你面前 你却不知道我爱你 世界上最遥远的距离 不是我就站在你面前你却不知道我爱你 而是明明知道彼此相爱…
Naive Bayes在mapreduce上的实现 原文地址 http://www.cnblogs.com/sunrye/p/4553732.html Naive Bayes是比较常用的分类器,因为思想比较简单.之所以说是naive,是因为他假设用于分类的特征在类确定的条件下是条件独立的,这个假设使得分类变得很简单,但会损失一定的精度. 具体推导可以看<统计学习方法> 经过推导我们可知y=argMaxP(Y=ck)*P(X=x|Y=ck).那么我们需要求先验概率也就是P(Y=ck)和求条件概率…
要实现微信小程序 在canvas画布上划动,页面禁止滑动,不仅要设置disable-scroll="true",还要要给canvas绑定一个触摸事件才能生效. <canvas canvas-id="myCanvas" class="myCanvas"  disable-scroll="false" bindtouchstart="touchStart" bindtouchmove="touc…
php7的特点是规则上不从堆上分配内存,改为从栈上分配内存, 因为有些场景是从堆上分配内在后,还要手动释放内存,利用栈分配内在快的特点,在有需要的时候,再在堆上分配内在 但是栈上分配的内存,不能返回,因为当函数运行完后,就退栈了,但可以将该内在地址传给别的函数 php7的hashTable中的Bucket中的zval不再是指针,而是直接存储zval 由于从php代码上不好分析,只要从扩展上分析 <?php $a=array(); $a['name']='taek-007'; ?> //////…
第一篇:wepy小程序实现列表分页上拉加载(1) 本文接着上一篇内容: 4.优化-添加加载动画 (1)首先写加载动画的结构和样式 打开list.wpy文件 template结构代码: <template> <view class="list-wrapper"> <!-- 滚动列表 --> <scroll-view scroll-y="true" style="height: 400px;" bindscr…
表记录查询小练习 查看岗位是teacher的员工姓名.年龄 查看岗位是teacher且年龄大于26岁的员工姓名.年龄 查看岗位是teacher且薪资在12000-16000范围内的员工姓名.年龄.薪资 查看岗位描述不为NULL的人员信息 查看岗位是teacher且薪资是10000或14000员工姓名.年龄.薪资 查看岗位是teacher且薪资不是10000或14000的员工姓名.年龄.薪资 查看岗位是teacher且名字是b开头的员工姓名.薪资 mysql> select * from t1;…
微信小程序简单封装图片上传组件 希望自己 "day day up" -----小陶 我从哪里来 在写小程序的时候需要上传图片,个人觉得官方提供的 Uploader 组件不是太好用,于是乎,看了官方文档,自己封装一个组件. 我是谁 直接上主题 在根目录下创建components文件夹 在components下开始创建自己的组件 效果图如下: 由于我使用的是flex布局,所以 我从哪里来 # wxml <view class="images-box"> &l…
最近在写微信小程序的上传图片功能,趟过了一些坑记录一下. 想要满足的需求是,从手机端上传图片至服务器,为了避免图片过大影响传输效率,需要把图片裁剪至适当大小后再传输 主要思路是,通过wx.chooseImage()函数获得图片的文件路径,在canvas画板获得文件路径后,重新绘制成制定大小的图片.再通过canvasToTempFilePath(),生成新的文件路径.最后通过wx.uploadFile()上传到指定服务器 遇到的坑有三个 一,在canvas中绘制的单位都是px,但由于不同屏幕的像素…
至上次重写ID3 MR版之后,手贱继续尝试CF.之前耳闻CF这两年内非常火,论内某大神也给了单机版(90%代码来自于其).所以想试试能否改到MR上.整体来说,CF本身的机制以相似性为核心,与迭代调用几乎无关联.所以在MR上的表现,未必能完全发挥MR作用.基本上是线性路子,一走到底.原先网上也有不少CF的介绍,不过以文文图图居多,对CF的时序性逻辑表达较少,讲的比较隐晦,现在通过代码剖析重新将其展现在大家面前(纯粹理论此处略过): 先贴图,贴图是王道: 1,整个MR过程其实与单机版90%重叠.仅期…
太久没动这里,目前人生处于一个新的开始.这次博客的内容很久前就想更新上来,但是一直没找到合适的时间点(哈哈,其实就是懒),主要内容集中在使用Mongodb时的一些隐蔽的MapReduce问题: 1.Reduce时的计数问题 2.Reduce时的提取数据问题 另外,补充一个小tips:mongoDB中建立的索引,优先使用固定的,而不要使用范围. 一.MapReduce时的计数问题 这个问题主要出现在使用“+1”的思路去计算累计次数时.如果在Map后的某一类中,记录量过大,就会导致计数失败. 具体演…
背景:这年小P已经参加工作4年了,在前同事Z的极力劝说下,小P加入了Z新开的公司Y,公司一共有三个人:老板Z.程序员小P.前台W.项目名为XX交易系统 小P加班加点,终于在两个月后把系统开发完成,版本为V1.0,这中间还包括需求分析(其实就是跟老板聊),概要设计.而系统的架构也是简单得不能再简单,如下图: 前台和后台都是最简单的java web,使用了当时最常用的SSH(Spring.Struts.Hibernate)框架,前端直接用了jsp(即html中嵌入java代码段)+jquery. 而…
背景 公司小程序上线了,发现系统无法拿到一些用户的UniondID.但是上线前的测试一切都是正常的. 坑1 经排查,发现一些用户通过下面的接口无法得到unionid https://api.weixin.qq.com/sns/jscode2session?appid=APPID&secret=SECRET&js_code=JSCODE&grant_type=authorization_code 阅读https://developers.weixin.qq.com/miniprogr…
前言: 也是在实际工作中, 借助jaxb来实现xml到java对象的映射转换. 在实际应用中, 也遇到了一些有趣好玩的东西, 权当记录下来. 本文主要讲解jaxb如何生成约定的xml报文头的实现思路, 点比较小, 而且方法有点trick, 因此导致取博文标题的时候, 也有些小迷茫, ^_^. 现象: 我们先来定义一个简单的java类, 并用于生成其对应的xml内容. @Getter @Setter @NoArgsConstructor @AllArgsConstructor @XmlAccess…
严格来说,这并不是一篇关于前端开发的文章,因为涉及到的知识非常浅.这只是一个向设计狮们分享的小经验,只是其中用到了一些前端内容. 最近接了个私活,了解到一个初创公司正在高价悬赏Logo(主要用于APP图标),我便投稿试了试,结果真的被选中了,得到了我认为远超Logo本身价值的奖金(看来跟着拿到投资的初创公司混真的有肉吃啊).闲话不表,设计完Logo之后我灵机一动,用iOS系统做了一个APP图标真实效果预览图,一起发给了甲方. 我们假设刚做好的Logo是下面这样的(这是样例图标,用我开发的UWP应…
转行IT初学者关于oracle数据库整理第一次安装数据库的时候都是按照操作步骤一步一步进行安装,并没有对操作步骤产生过怀疑或者为什么要这么进行操作?2017年12月8日再次阅读安装操作说明书的时候有了新的理解,所以就用微博给记录下来,方便自己以后查看:1.用浏览器访问数据库的时候选择http://localhost:5560/isqlplus/访问isql:http://localhost:1158/em/console/logon/logon;jsessionid=c0a80175486359…
微信小程序里面自己给了一个时间工具,是用来记录log日志,感觉可以记录下来,所以拿来自己用,以此记录: 直接传入 日期对象 进入 formatTime //得到下面格式的时间格式2017/07/22 14:24:36在此基础上可以自己扩展更多 格式,例如:XXXX-XX-XX XX:XX:XX 等等: function formatTime(date) { var year = date.getFullYear() var month = date.getMonth() + 1 var day…
  今天提了一个bug,有几张图片在安卓上面加载会先变大拉伸再恢复正常 出现这样的问题应该是用widthFix造成的 具体原因还不是很清楚,因为都是本地图片,所以我就直接把高也设置好就暂时没有这个问题了. 但是万一网络图片也出现这种问题,暂时还不清楚该如何解决.有碰到类似问题的可以下方讨论! 另外关于小程序导航 我目前需求是A->B->C->D 然后从D可以直接返回到A 也可以D->B->C->D,也可以从C->A这样子 开始用的方法是在B进入C的时候用redir…
要搞一个小型的cms内容发布系统 因为小程序上线之后,直接对数据库进行操作的话,慧出问题的,所以一般都会做一个管理系统,让工作人员通过这个管理系统来对这个数据库进行增删改查 微信小程序其实给我们提供了这样的能力了 (也就是可以在自己已有的服务器来进行云操作,所以就可以通过这个CMS内容管理系统来对云数据库进行修改) 我们就要建立自己的web服务器-->搭建一个简易的服务器 https://koa.bootcss.com/ 这个是要node版本是7以上,可以在node官网去搭建,我这边之前按照过了…
LocalDB使用确实方便,它不像SQLSERVER那么重,对一个测试的DEMO或者并发量不大的项目可以使用它,但在进行IIS部署时,可能会出现一些问题,即你的IIS可能没有权限访问你的LocalDB,现在我们就来简单的配置一下,让它支持IIS!1.在命令行中启用共享LocalDB连接(需要管理员权限):sqllocaldb share v11.0 IIS_DB2.使用Microsoft SQL Server Management Studio连接LocalDB:服务器名称:(localdb)\…
[小细节,大BUG] 6.问题描述:当从Plist文件加载数据,放入到tableView中展示时,有时有数据,有时又没有数据.这是为什么呢?相信很多大牛都想到了:我们一般将加载的数据,转换成模型,放入到数组中去.然后根据数组,动态的进行数据展示.结果错误就在此:对数组的引用使用了weak,所以造成了数据有时丢失的情况.那么有个细节不知道各位有没有注意到,为什么有时有,有时没有呢?这就关系到XCODE对僵尸对象的处理了,详细介绍请看本博客中的<OC内存管理--zombie对象> [小细节,大BU…
作者:程程链接:https://zhuanlan.zhihu.com/p/21432547来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处. 深度学习大讲堂致力于推送人工智能,深度学习方面的最新技术,产品以及活动.请关注我们的知乎专栏! 一.DL基础理论 本页PPT给出了本节内容概要,我们从MCP神经元模型开始,首先回顾全连接层.卷积层等基础结构单元,Sigmoid等激活函数,Softmax等损失函数,以及感知机.MLP等经典网络结构.接下来,将介绍网络训练方法,包括…
Naive Bayes是比较常用的分类器,因为思想比较简单.之所以说是naive,是因为他假设用于分类的特征在类确定的条件下是条件独立的,这个假设使得分类变得很简单,但会损失一定的精度. 具体推导可以看<统计学习方法> 经过推导我们可知y=argMaxP(Y=ck)*P(X=x|Y=ck).那么我们需要求先验概率也就是P(Y=ck)和求条件概率p(X=x|Y=ck). 具体的例子以:http://blog.163.com/jiayouweijiewj@126/blog/static/17123…
说说最近在开发微信小程序语音识别遇到的问题吧 最先使用微信小程序录音控件可以拿到silk格式,后来微信官方又支持mp3格式了 但是我们拿到这些格式以后,都还不能直接使用,做语音识别,因为目前百度的语音识别格式不支持mp3格式的 百度php语音识别接口 http://yuyin.baidu.com/docs/asr/188 但是有支持wav格式的,于是又要想办法怎么把mp3格式转为wav格式 在百度搜了一大圈 最后知道说要使用一个ffmpeg组件 于是继续搜资料 看看Linux服务器如何安装ffm…