Metadata-Version: 2.1
Name: classicML
Version: 0.6b1
Summary: An easy-to-use ML framework
Home-page: https://github.com/sun1638650145/classicML
Author: Steve R. Sun
Author-email: s1638650145@gmail.com
License: Apache Software License
Platform: UNKNOWN
Classifier: Development Status :: 4 - Beta
Classifier: License :: OSI Approved :: Apache Software License
Classifier: Operating System :: OS Independent
Classifier: Programming Language :: C++
Classifier: Programming Language :: Python :: 3
Classifier: Topic :: Scientific/Engineering :: Artificial Intelligence
Requires-Python: >=3.6
Description-Content-Type: text/markdown
Requires-Dist: h5py (>=2.10.0)
Requires-Dist: matplotlib (>=3.3.2)
Requires-Dist: numpy (<=1.19.4,>=1.19.2)
Requires-Dist: pandas (<=1.1.4,>=1.1.3)
Requires-Dist: psutil (>=5.7.2)

# classicML: 简单易用的经典机器学习框架

![build](https://github.com/sun1638650145/classicML/workflows/build/badge.svg) ![PyPI](https://github.com/sun1638650145/classicML/workflows/PyPI/badge.svg) [![Documentation Status](https://readthedocs.org/projects/classicml/badge/?version=latest)](https://classicml.readthedocs.io/zh_CN/latest/?badge=latest)

classicML 是一个用Python和CPP混编的机器学习项目，它既实现了Python的简单易用快速上手，又实现了CPP的高效性能。classicML的设计目标是简单易用，快速入门，编程风格简洁。

## 多后端支持

classicML 本身是一个Python项目，但是机器学习中涉及到的复杂的矩阵运算对于Python有点儿捉襟见肘，因此我们提供了使用CPP后端的函数的加速版本。为了保证兼容性，classicML默认使用Python后端，部分算法支持了使用CPP作为后端进行加速，你需要安装标准版的classicML，然后在开头使用这条语句切换后端。

```python
import os
os.environ['CLASSICML_ENGINE'] = 'CC'
```

## 第一个机器学习程序

使用线性判别分析进行二分类

* 下载示例数据集

```shell
wget https://github.com/sun1638650145/classicML/blob/master/datasets/西瓜数据集alpha.csv
```

* 运行下面的代码

```python
import pandas as pd
import classicML as cml

DATASET_PATH = '/path/to/西瓜数据集alpha.csv'

# 读取数据
dataframe = pd.read_csv(DATASET_PATH, index_col=0, header=0)
x = dataframe.iloc[:, :2].values
y = dataframe.iloc[:, 2].values
y[y == '是'] = 1
y[y == '否'] = 0
# 生成模型
model = cml.models.LDA()
# 训练模型
model.fit(x, y)
# 可视化模型
cml.plots.plot_lda(model, x, y, '密度', '含糖率')
```

* [更多示例代码点击](https://github.com/sun1638650145/classicML/tree/master/examples)

## 目前的已支持的算法

classicML 目前支持数种机器学习算法，但是每种算法实现的情况有所不同和差异。

|      算法名称      | 支持多分类 | 使用CC加速 | 可视化 | 同时处理离散和连续值 | 保存和加载权重 |
| :----------------: | :--------: | :--------: | :----: | :------------------: | :------------: |
|      逻辑回归      |            |     ✅      |   ✅    |                      |       ✅        |
|    线性判别分析    |            |     ✅      |   ✅    |                      |       ✅        |
|     BP神经网络     |     ✅      |     ✅      |   ✅    |          ✅           |       ✅        |
| 径向基函数神经网络 |            |     ✅      |   ✅    |                      |       ✅        |
|   支持向量分类器   |            |     ✅      |   ✅    |                      |       ✅        |
|     分类决策树     |     ✅      |     ✅      |   ✅    |          ✅           |       ✅        |
|  朴素贝叶斯分类器  |            |     ✅      |   ✅    |          ✅           |       ✅        |
|  平均独依赖估计器  |            |     ✅      |        |          ✅           |       ✅        |
|  超父独依赖估计器  |            |     ✅      |   ✅    |          ✅           |       ✅        |

1. 全部神经网络只能可视化损失和评估函数曲线，暂不能可视化结构信息
2. BP神经网络需要手动将离散值转换成dummy编码

## classicML 0.6 预览

> 这个发行版将以性能优化和原生支持Apple Silicon为更新目标
>
> 1. 原生支持(native support) Apple M1
> 2. 增加大量```CC```后端函数，将主要的操作全部用```CC```重写，大幅提高性能
> 3. 修复BUG，提高稳定性

