python numpy包简单安装

November 30
python numpy包简单安装
方法一:PIP 1 下载numpy包:    http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy 2 把whl文件拷贝至pip所在的文件夹(scripts) 3 命令行进入该文件夹,输入:pip install  安装包文件名  方法二:setup.py 1 命令行进入包所在目录 2 输入: python setup.py install 包文件名

Python数据挖掘实例(实时更新)

November 30
Python数据挖掘实例(实时更新)
案例1 数据挖掘实战之DBLP中合作者挖掘(Python+Hadoop) URL: 案例2 [机器学习]机器学习综述与"Hello World"实战(附带5个实例)URL: 案例3 新闻分类系统(Python):爬虫(bs+rq)+数据处理(jieba分词)+分类器(贝叶斯)URL: 案例4 很污的机器学习:从xhamster网站找到喜欢的片子URL:

数据挖掘概念汇总及数据预处理

November 30
数据挖掘概念汇总及数据预处理
数据挖掘简介 数据挖掘,顾名思义,就是在大量的数据中发现有用的信息,随着信息技术发展,每天都会产生大量的数据,可以说我们正处于一个大数据的时代.面对如此多的数据,传统的分析方法不再适用,这就需要我们用新的技术工具来从数据中找到隐藏的信息. 数据挖掘的应用相当广泛,比如最"超市出售商品间的关联分析"(数据分析课上必然提到的"啤酒尿布"的例子),"根据历史数据做气候观测"."生物学生的基因序列分析"等等等等.说到"啤酒尿

用Python进行数据挖掘(数据预处理)

November 30
用Python进行数据挖掘(数据预处理)
用Python进行数据挖掘(数据预处理) 本博客进行数据预处理的方法总结自kaggle的几道题目: 1.HousePrices 2.Titanic 以及比较不错的几个kernels: 1.https://www.kaggle.com/pmarcelino/house-prices-advanced-regression-techniques/comprehensive-data-exploration-with-python/run/1432348 2.https://www.kaggle.co

《python数据挖掘》和《python数据挖掘入门与实践》两本书读后感

November 30
《python数据挖掘》和《python数据挖掘入门与实践》两本书读后感
这些天花了很多时间来学习数据挖掘这门课程,有很多心得和感悟,所以写下这篇博客来表达自己读完这两本书的感受! 首先推荐大家通过这两本书来入门数据挖掘这个领域,python数据挖掘这本书较容易,还花了很大的篇幅来讲python基础,而python数据挖掘入门与实践则直接从实例讲起,需要读者有一定的python基础. 数据挖掘主要是通过python或者R语言来实现的,因为这两门语言有它们独特的优势,比如包含大量的函数式编程接口,高效的模块等等,这些都使它们非常适合用来进行数据挖掘和数据分析.所以都要求

Python散点图(Pandas + Matplotlib)实战--身高体重分布图

November 30
Python散点图(Pandas + Matplotlib)实战--身高体重分布图
简单绘制一个散点图. 数据使用小朋友的身高和体重,简单看看. 数据结构:下面看一下其中几条的部分内容,我们只需要其中身高(Height)和体重(Weight)列的数据: 共七万五千多条,下面看看通过pandas+matplotlib绘制出散点图. 注释写的很详细了,直接看代码很简单: #!/usr/bin/env python3 # -*- coding: utf-8 -*- """ Created 数据库数据导出excle 这里简单加载展示身高体重图 @author: ge

常见数据挖掘算法和Python简单实现

November 30
常见数据挖掘算法和Python简单实现
1.K近邻算法 原理:计算待分类样本与每个训练样本的距离,取距离最小的K个样本,这k个样本,哪个类别占大多数,则该样本属于这个类别. 优点:1.无需训练和估计参数,2.适合多分类,3.适合样本容量比较大的问题 缺点:1.对测试样本内存开销大,2.可解释性差,无法生成规则,3.对样本量小的问题,容易误分 经验:K一般低于样本量的平方根,基于交叉验证 问题:类别判断:投票法没有考虑距离的远近,可以采用加权投票''           高维度变量:维度越高,欧氏距离的区分能力越差. import nu

25 pandas的使用,转成numpy数组以及将list数组保存成csv格式的文件

November 30
25 pandas的使用,转成numpy数组以及将list数组保存成csv格式的文件
seriesuid coordX coordY coordZ diameter_mm Unnamed: 5 0 1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222- -128.699421 -175.319272 -298.387506 5.651471 NaN 1 1.3.6.1.4.1.14519.5.2.1.6279.6001.100225287222- 103.783651 -211.925149 -227.121250 4.224708 NaN

python:matplotlib及pandas绘图(1)

November 30
python:matplotlib及pandas绘图(1)
利用python进行数据分析 第八章:绘图和可视化 matplotlib APL入门 >>> import matplotlib.pyplot as plt >>> import numpy as np 1,Figure和Subplot matplotlib的图像都位于Figure对象中,可通过plt.figure创建一个新的Figure >>> fig=plt.figure() #创建一个新的Figure >>> plt.show(

CODEVS 1474 十进制转m进制

November 30
CODEVS 1474 十进制转m进制
题目描述 Description 将十进制数n转换成m进制数 m<=16 n<=100 输入描述 Input Description 共一行 n和m 输出描述 Output Description 共一个数 表示n的m进制 样例输入 Sample Input 样例1:10 2 样例2:100 15 样例输出 Sample Output 样例1:1010 样例2:6A 数据范围及提示 Data Size & Hint 用反向取余法 #include<iostream> usi

关于MATLAB中使用的UBIT1问题

November 30
关于MATLAB中使用的UBIT1问题
                 最近在看基于LSB方法的信息隐藏的时候遇到fread函数中的'ubit1'不知何解,于是提取其中的函数如下 file='message.txt'; f_id=fopen(file,'r'); [msg,len_total]=fread(f_id,'ubit1') 单独看了下,message中存放数据1,运行结果是:len_total=8,msg=10001100;为了对比把message中 的数据改成了2:运行结果是:len_total=8,msg=010011

Codevs 1048 石子归并

November 30
Codevs 1048 石子归并
1048 石子归并 题目描述 Description 有n堆石子排成一列,每堆石子有一个重量w[i], 每次合并可以合并相邻的两堆石子,一次合并的代价为两堆石子的重量和w[i]+w[i+1].问安排怎样的合并顺序,能够使得总合并代价达到最小. 输入描述 Input Description 第一行一个整数n(n<=100) 第二行n个整数w1,w2...wn  (wi <= 100) 输出描述 Output Description 一个整数表示最小合并代价 样例输入 Sample Input 4

Maltab gui 使用函数学习记录

November 30
Maltab gui 使用函数学习记录
简要记录在MATLAB的 gui编写中常用的函数知识. MATLABgui 和mfc有点像,但是比mfc的消息传输机制简单些,MATLAB都是一个控件一个响应. 一个控件可以有call back函数,是最常用的:点击按钮时,按钮下的Callback就会执行:拖动滑块时,滑块名下的callback就会执行:一般函数的执行部分都在call back下,可以通过设置控件的call back属性实现. ButtonDownFcn:单击,这个函数名下的代码就会执行,如果有callback,会覆盖掉这个.

MATLAB gui wait的使用

November 30
MATLAB gui wait的使用
进度条的调用格式为:h = waitbar(x, 'title', '后面可以加属性,和GUI一样'); X是分数到1的时候为百分之百,x = a/b; 使用get(h);,或者get(waitbar(x, 'title'));可以查看进度条的属性. 常用到的属性有'WindowStyle'默认为 normal,可以改成'modal'设置进度条已知在屏幕前面,小tips:如果程序在调试的时候,最好不要设置成modal因为这样程序出错不会跳转,无法继续调试(不过应该用不上吧,谁调试的时候不关wai

类中的静态成员小总结

November 30
类中的静态成员小总结
  因为一个疑问:静态成员函数不能被对象调用?静态成员函数应该是既可以通过类名直接调用,也可以通过对象名进行调用.还有一个疑问就是:私有的静态成员变量在类外使用是否影响了封装性?这个答案应该是静态成员变量不能在类外使用只是在类外初始化.因为疑问引发了对类中静态是怎么使用的,各对象如何调用的思考.       使用静态成员在类加载的时候就会分配内存存,可以通过类名直接去访问:非静态成员(变量和方法)属于类的对象,所以只有在类的对象产生(创建类的实例)时才会分配内存,然后通过类的对象(实例)去访问.

maltab中读取与写入文件

November 30
maltab中读取与写入文件
  在MATLAB读写文件常用到的函数:  fopen  打开文件,或者获取打开文件的信息:fclose 关闭打开的文件:fgetl  读入一行,忽略换行符:fgets  读入一行,直到换行符:fread  从文件中读取二进制数据:fwrite 向文件中写入数据:fscanf 格式化读入:fprintf 格式化输入数据到文件: 打开文件:先用fopen函数打开文件,并指定对该文件进行的操作方式. fopen函数的调用格式为:fid=fopen(文件名,'打开方式'):  其中fid文件句柄值,如

使用形态学操作实现边界提取

November 30
使用形态学操作实现边界提取
    使用形态学操作实现边界提取的思路:             1.首先对图像A进行腐蚀,             2.之后再使用A减去腐蚀后的结果即是提取到的边界             opencv中代码如下: #include <iostream> #include <opencv2/opencv.hpp> int main() { cv::Mat src=cv::imread("../1.jpg"); cv::imshow("input&q

形态学之边界提取

November 30
形态学之边界提取
边界提取的算法如下: β(A)=A−(A⊖B)\beta(A)=A-(A\ominus B)β(A)=A−(A⊖B) 其中B是一个适当的结果元 如上所示,该公式是一个很明显的边界提出公式,B对A做腐蚀,将A的边界进行腐蚀,而A减去腐蚀后的结果就是被腐蚀的部分,即边界,其中边界的粗细取决于element B的大小. 以上.

二值图像孔洞填充

November 30
二值图像孔洞填充
(这里的二值为0和255) 二值图像的孔洞填充是基于图像形态学操作的基本运算,本文参考数字图像处理(冈萨雷斯著)相关章节的有关内容并结合作者自己的思考,给出了基于C# 二值图像孔洞填充的可行程序. 基础知识:参考数字图像处理 P402-P415 数学形态学的语言是集合论,这里所说的孔洞是二值图像内部八连通点阵组成的闭合圈内的像素点集,孔洞填充的基本步骤如下: 1.确定二值图像像素[0,0]为初始种子点,这里认为[0,0]像素点为背景点,而非某个孔洞内部的点. 2.以种子点为起点,采用形态学膨胀算

matlab查找二值化图像边缘与二值图像形态学运算

November 30
matlab查找二值化图像边缘与二值图像形态学运算
Matlab函数bwmorph简介 函数功能: 对二值图像进行数学形态学(Mathematical Morphology)运算. 语法格式: BW2 = bwmorph(BW,operation) 对二值图像进行指定的形态学处理. BW2 = bwmorph(BW,operation,n) 对二值图像进行n次指定的形态学处理. n可以是Inf(无穷大),这意味着将一直对该图像做同样的形态学处理直到图像不再发生变化. operation是一个字符串, 用于指定进行的形态学处理类型, operati