TensorFlow2入门到进阶—

归一化有多种，最常用的就是最大最小值和正态分布归一化，下面将利用sklearn来实现数据归一化。

# x=(x-u)/std   符合正态分布

from sklearn.preprocessing import StandardScaler
#之前x_train为np.int型，所以先转为float32

scaler = StandardScaler()
x_train_scaled = scaler.fit_transform(
    x_train.astype(np.float32).reshape(-1,1)).reshape(-1,28,28)
x_valid_scaled = scaler.transform(
    x_valid.astype(np.float32).reshape(-1,1)).reshape(-1,28,28)
x_test_scaled = scaler.transform(
    x_test.astype(np.float32).reshape(-1,1)).reshape(-1,28,28)

fit_transform()为归一化函数，要求输入为一维数组，并将记录均值和方差，所以第一次使用归一化时要调用这个函数，并将输入数据转换为1维数组。

transform()为归一化函数，但不记录均值和方差，使用之前的均值和方差，所以在第二次及以后归一化时直接调用该函数。

reshape(-1,1)表示将原数据转为n行1列的数组，-1根据原数组的数据量决定。

reshape(-1,28,28) ：归一化之后再按照之前数据集的格式恢复。

未经允许不得转载！TensorFlow2入门到进阶—— 归一化实现