xml地图|网站地图|网站标签 [设为首页] [加入收藏]
澳门新葡亰手机版机器学习算法_knn,所以永恒
分类:编程

出现这个情况的原因是:没有使用 DispatchQueue.main.async

这两天翻了一下机器学习实战这本书,算法是不错,只是代码不够友好,作者是个搞算法的,这点从代码上就能看出来。可是有些地方使用numpy搞数组,搞矩阵,总是感觉怪怪的,一个是需要使用三方包numpy,虽然这个包基本可以说必备了,可是对于一些新手,连pip都用不好,装的numpy也是各种问题,所以说能不用还是尽量不用,第二个就是毕竟是数据,代码样例里面写的只有几个case,可是实际应用起来,一定是要上数据库的,如果是array是不适合从数据库中读写数据的。因此综合以上两点,我就把这段代码改成list形式了,当然,也可能有人会说我对numpy很熟悉啊,而且作为专业的数学包,矩阵的运算方面也很方便,我不否定,那我这段代码恐怕对你不适合,你可以参考书上的代码,直接照打并理解就好了。

目录:

TableView.reloadData()必须写在那个里面。

knn,不多说了,网上书上讲这个的一大堆,简单说就是利用新样本new_case的各维度的数值与已有old_case各维度数值的欧式距离计算

  一、打开文件

// Asynchronously reload the data and display on the tableview
DispatchQueue.main.async {
        // Reload the tableview
        self.searchResultTableView.reloadData()
}

欧式距离这里也不说了,有兴趣可以去翻我那篇python_距离测量,里面写的很详细,并用符号展示说明,你也可以改成棋盘距离或街区距离试试,速度可能会比欧式距离快,但还是安利欧式距离。

  二、文件对象的方法

顺便提一句我出现的错误现象:我的UIView上有一个Search button,从youtube API上根据用户在文本框中输入的关键字读取youtube返回的Json信息。点击Search button两次才会显示数据,更改关键词以后也是这样,第一次按下Search button,仍然是之前的搜索结果。但在console上,第一次点击Search后,就已经出现新的搜索结果。

有一点没搞明白的就是,对坐标进行精度化计算这块,实测后确定使用直接计算无论是错误率还是精度,处理前都要比处理后更准确,可能原代码使用小数点的概率更高些吧,也许这个计算对于小数计算精度更有帮助

  三、文件的关闭

 

闲话一些,不多也不少,下面上代码,代码中配有伪代码,方便阅读,如果还看不太明白可以留言,我把详细注释加上

  四、文件的读取和定位

DispatchQueue.main.async的意思是 异步。就是让reloadData()加载的数据异步更新到main thread上。不然tableView数据只会在后台准备好,下一次按button才会显示。

 

  五、文件的写入

 

以下是代码中使用颜色,选用html的16进制RGB颜色,在应用时将其转换为10进制数字计算,old_case选取红色圈,new_case选取橙色圈

  六、课时28课后习题及答案

紫色(茄子颜色)

 

澳门新葡亰手机版 1

大多数程序都遵循着:输入->处理->输出的模型,首先接受输入数据,然后按照要求进行处理,最后输出结果。现在我们不再只满足使用input接受用户的输入,使用print输出处理的结果了。我们迫切想要关注到系统的方方面面,用代码自动分析系统的日志,分析的结果可以保存为一个新的日志,甚至可以跟外面的世界进行交流。

绿色(黄瓜颜色)

在编写程序的时候,操作系统为了更快的做出响应,把所有当前的数据都放在内存中。但内存有个天生的不足,一断点就没戏,emmmm。ctrl

澳门新葡亰手机版 2

  • s 学起,保存数据!

黄色(香蕉颜色)

****************

澳门新葡亰手机版 3

一、打开文件

淡绿(西葫芦颜色)

****************

澳门新葡亰手机版 4

在Python中,使用open()这个函数来打开文件并返回文件对象:help(open)

代码见下

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

#!/usr/bin//python
# coding: utf-8

'''
1、获取key和coord_values,样例使用的是list,但是如果真正用在训练上的话list就不适合了,建议改为使用数据库进行读取
2、对坐标进行精度化计算,这个其实我没理解是为什么,可能为了防止错误匹配吧,书上是这样写的
3、指定两个参数,参数一是新加入case的坐标,参数二是需要匹配距离最近的周边点的个数n,这里赢指定单数
4、距离计算,使用欧式距离
  新加入case的坐标与每一个已有坐标计算,这里还有优化空间,以后更新
  计算好的距离与key做成新的key-value
  依据距离排序
  取前n个case
5、取得key
  对前n个case的key进行统计
  取统计量结果最多的key即是新加入case所对应的分组
6、将新加入的values与分组写成key-value加入已有的key-value列队
输入新的case坐标,返回第一步......递归
'''

import operator

def create_case_list():
  # 1代表黄瓜,2代表香蕉,3代表茄子,4代表西葫芦
  case_list = [[25,3,73732],[27.5,8,127492],[13,6,127492],[16,13,50331049],[17,4,18874516],[22,8,13762774],[14,1,30473482],[18,3,38338108]]
  case_type = [1,1,2,2,3,3,4,4]
  return case_list,case_type

def knn_fun(user_coord,case_coord_list,case_type,take_num):
  case_len = len(case_coord_list)
  coord_len = len(user_coord)
  eu_distance = []
  for coord in case_coord_list:
    coord_range = [(user_coord[i] - coord[i]) ** 2 for i in range(coord_len)]
    coord_range = sum(coord_range) ** 0.5
    eu_distance.append(coord_range)
  merage_distance_and_type = zip(eu_distance,case_type)
  merage_distance_and_type.sort()
  type_list = [merage_distance_and_type[i][1] for i in range(take_num)]
  class_count = {}
  for type_case in type_list:
    type_temp = {type_case:1}
    if class_count.get(type_case) == None:
      class_count.update(type_temp)
    else: class_count[type_case] += 1
  sorted_class_count = sorted(class_count.iteritems(), key = operator.itemgetter(1), reverse = True)
  return sorted_class_count[0][0]

def auto_norm(case_list):
  case_len = len(case_list[0])
  min_vals = [0] * case_len
  max_vals = [0] * case_len
  ranges = [0] * case_len
  for i in range(case_len):
    min_list = [case[i] for case in case_list]
    min_vals[i] = min(min_list)
    max_vals[i] = max([case[i] for case in case_list])
    ranges[i] = max_vals[i] - min_vals[i]
  norm_data_list = []
  for case in case_list:
    norm_data_list.append([(case[i] - min_vals[i])/ranges[i] for i in range(case_len)])
  return norm_data_list,ranges,min_vals

def main():
  result_list = ['黄瓜','香蕉','茄子','西葫芦']
  dimension1 = float(input('长度是: '))
  dimension2 = float(input('弯曲度是: '))
  dimension3 = float(input('颜色是: '))
  case_list,type_list = create_case_list()
  #norm_data_list,ranges,min_vals = auto_norm(case_list)
  in_coord = [dimension1,dimension2,dimension3]
  #in_coord_len = len(in_coord)
  #in_coord = [in_coord[i]/ranges[i] for i in range(in_coord_len)]
  #class_sel_result = knn_fun(in_coord,norm_data_list,type_list,3)
  class_sel_result = knn_fun(in_coord,case_list,type_list,3)
  class_sel_result = class_sel_result - 1
  return result_list[class_sel_result]

if __name__ == '__main__':
  a = main()
  print '这货是: %s' %a

open()这个函数是有很多参数的,但作为初学者的我们,只需要先关注第一个参数和第二个参数即可。第一个参数是传入的文件名,如果只有文件名,不带路径的话,那么python会在当前文件夹中去找到该文件并打开。如果要打开的文件不存在呢?那就要看第二个参数了,第二个参数指定打开文件的模式:

测试结果,效果还不赖

打开模式      执行操作
'r'            以只读方式打开文件(默认)
'w'            以写入的方式打开文件,会覆盖已存在的文件
'x'            如果文件已经存在,使用此模式打开将引发异常
'a'            以写入模式打开,如果文件存在,则在末尾追加写入
'b'            以二进制模式打开文件
't'            以文本模式打开(默认)
'+'            可读写模式(可添加到其他模式中使用)
'U'            通用换行符支持

澳门新葡亰手机版 5

使用open成功打开一个文件后,它会自动返回一个文件对象,拿到这个文件对象,就可以读取或者修改这个文件:

>>> #先将record.txt文件放到Python的根目录下(如:C:Python34)

>>> f = open("record.txt")

>>> 

没有消息就是好消息,表示我们的文件被成功打开了。

***********************

二、文件对象的方法

本文由澳门新葡亰手机版发布于编程,转载请注明出处:澳门新葡亰手机版机器学习算法_knn,所以永恒

上一篇:返回的中文问题,linux动态库编译和使用详细剖析 下一篇:0与融云IMKIT开发问题,为什么Python为这么慢
猜你喜欢
热门排行
精彩图文