XGBoost xgboost是大规模并行boosted tree的工具,它是目前最快最好的开源boosted tree工具包,比常见的工具包快10倍以上。在数据科学方面,有大量kaggle选手选用它进行数据挖掘比赛,其中包括两个以上kaggle比赛的夺冠方案。在工业界规模方面,xgboost的分布式版本有广泛的可移植性,支持在YARN, MPI, Sungrid Engine等各个平台上面运行,并且保留了单机并行版本的各种优化,使得它可以很好地解决于工业界规模的问题。 XGBoost的优点 正则化 XGBoost…

2020年07月12日 0条评论 6点热度 1人点赞 阅读全文

直接从工具链源里安装: 然后是配置指令,优先级可以自己定: 然后: gcc -v 参考:https://askubuntu.com/questions/863517/how-do-i-install-g-7-on-ubuntu

2020年07月10日 0条评论 11点热度 0人点赞 阅读全文

安装cuda 选择合适的cuda版本,然后进行安装。cuda下载:https://developer.nvidia.com/cuda-toolkit-archive 安装cudnn 111 CUDA,NVIDIA Driver,Linux,GCC之间的版本对应关系表格 在安装CUDA时一定要注意其与英伟达显卡驱动以及Linux系统和GCC版本的对应关系,如果版本之间不匹配,是安装不成功的。 一、CUDA与Driver的对应版本 CUDA Toolkit Linux x86_64 Driver Version Win…

2020年07月10日 0条评论 12点热度 1人点赞 阅读全文

集体智慧 综合若干错误的预测结果,可以得到正确的预测结果吗?答案是可以!这好像违背直觉,但优秀的预测模型可以做到,甚至理应如此。 这基于以下事实:虽然错误的预测结果可能有很多,但是正确的只有一个。通过组合具有不同优缺点的模型,往往能强化正确的预测结果,同时使错误相互抵消。这种通过组合不同模型来提高预测准确度的方法被称为集成方法。 前面学习了决策树,本文主要讲的随机森林就是基于决策树的一种集成方法。为了说明随机森林为何优于决策树,我们首先生成1000棵决策树,用来预测可能发生在美国旧金山的犯罪行为,然后基于这1000…

2020年07月09日 0条评论 13点热度 1人点赞 阅读全文

参考anaconda官方文档:https://docs.anaconda.com/anaconda/ 通常我们使用命令: conda create -n env_name python=x.x 创建一个环境,但是此时环境默认  $HOME/.conda/envs/env_name,在激活这个环境的时候,可以使用命令: source activate env_name 退出命令: source deactivate env_name 但有时侯我们需要指定环境的路径,因此可以使用命令: conda creat…

2020年07月09日 0条评论 6点热度 0人点赞 阅读全文

com.alibaba.fastjson下载见全文 下载点这

2020年07月07日 0条评论 34点热度 1人点赞 阅读全文

目录: 第1章  控制系统简介 1.1  引言 1.1.1  控制理论和实践发展史的简单回顾 1.1.2  定义 1.2  控制系统举例 1.2.1  速度控制系统 1.2.2  温度控制系统 1.2.3  业务系统 1.2.4  鲁棒控制系统 1.3  闭环控制和开环控制 1.3.1  反馈控制系统 1.3.2  闭环控制系统 1.3.3  开环控制系统 1.3.4  闭环与…

2020年07月07日 0条评论 22点热度 2人点赞 阅读全文

本文会给出一些使用概率论进行分类的方法。首先从一个最简单的概率分类器开始,然后给出一些假设来学习朴素贝叶斯分类器。我们称之为“朴素”,是因为整个形式化过程只做最原始、最简单的假设。不必担心,你会详细了解到这些假设。我们将充分利用Python的文本处理能力将文档切分成词向量,然后利用词向量对文档进行分类。我们还将构建另一个分类器,观察其在真实的垃圾邮件数据集中的过滤效果,必要时还会回顾一下条件概率。最后,我们将介绍如何从个人发布的大量广告中学习分类器,并将学习结果转换成人类可理解的信息。 基于贝叶斯决策理论的分类方法…

2020年07月06日 0条评论 12点热度 1人点赞 阅读全文

所谓机器学习和深度学习, 背后的逻辑都是数学, 所以数学基础在这个领域非常关键, 而统计学又是重中之重, 机器学习从某种意义上来说就是一种统计学习。 本文主学习七种机器学习领域中常见的数据分布。 本文的第二部分假设检验是统计推断中的一类重要问题,在总体的分布函数完全未知或只知其形式,不知其参数的情况,为了推断总体的某些未知特性,提出某些关于总体的假设,然后收集数据去构造统计量测试,以决定总体假设的正确性, 这就是假设检验的过程。 大纲如下: 常见分布(正态, 拉普劳斯, 伯努利, 二项, 均匀, 泊松, 指数) 假…

2020年07月04日 0条评论 25点热度 0人点赞 阅读全文

2020年07月04日 0条评论 29点热度 3人点赞 阅读全文
1234578