import tensorflow as tf
from tensorflow import keras

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# chargement du dataset AutoMPG de puis le site ce l'UCI
url = 'http://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data'
column_names = ['MPG', 'Cylinders', 'Displacement', 'Horsepower', 'Weight',
                'Acceleration', 'Model Year', 'Origin']

raw_dataset = pd.read_csv(url, names=column_names,
                          na_values='?', comment='\t',
                          sep=' ', skipinitialspace=True)
X = raw_dataset.drop(columns='MPG')
y = raw_dataset['MPG']

X_tensor = tf.data.Dataset.from_tensors(X)
y_tensor = tf.data.Dataset.from_tensors(y)

X_tensor

list(X_tensor.as_numpy_iterator())

normalizer = tf.keras.layers.Normalization(axis=-1)
normalizer.adapt(X_tensor)

from tensorflow.keras import layers
data = [
    "ξεῖν᾽, ἦ τοι μὲν ὄνειροι ἀμήχανοι ἀκριτόμυθοι",
    "γίγνοντ᾽, οὐδέ τι πάντα τελείεται ἀνθρώποισι.",
    "δοιαὶ γάρ τε πύλαι ἀμενηνῶν εἰσὶν ὀνείρων:",
    "αἱ μὲν γὰρ κεράεσσι τετεύχαται, αἱ δ᾽ ἐλέφαντι:",
    "τῶν οἳ μέν κ᾽ ἔλθωσι διὰ πριστοῦ ἐλέφαντος,",
]
layer = layers.TextVectorization()
layer.adapt(data)
vectorized_text = layer(data)
print(vectorized_text)

 model = tf.keras.Sequential([
  # couche 1
  # couche 2
  # ...   
  ])

model = tf.keras.Sequential()
model.add(...) # on passe en argument un objet layer
model.add(...)
...

model.summary()

 model = tf.keras.Sequential([
    keras.layers.Dense(64, activation='relu'),
    keras.layers.Dense(64, activation='relu'),
    keras.layers.Dense(10)
  ])

model.compile(optimizer = tf.keras.optimizers.adam())

# si vous choisissez parmi la liste proposées
model.compile(loss = "binary_crossentropy")


# ou en utlisant l'objet dédié (plus flexible)
loss = keras.losses.BinaryCrossentropy(...)
model.compile(loss = loss)

# si vous choisissez de coder votre propre loss
def custom_mse(y_true, y_pred):
    squared_diff = tf.square(y_true - y_pred)
    return tf.reduce_mean(squared_diff)

model.compile(loss=custom_mse)

model.compile(metrics=[tf.keras.metrics.RootMeanSquaredError()])

loss, accuracy = model.evaluate(X_test,y_test)

model.compile(loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
              optimizer = tf.keras.optimizers.adam(learning_rate=base_learning_rate/10),
              metrics=[tf.keras.metrics.RootMeanSquaredError()])

history = model.fit(X_train, y_train,
          validation_split=0.3,
          batch_size=16,
          epochs=100)

history = model.fit(X_train, y_train,
          validation_data=(X_val, y_val), 
          batch_size=16,
          epochs=100)

def model_builder(hp):
  model = keras.Sequential()
  model.add(keras.layers.Flatten(input_shape=(28, 28)))

  # Tune the number of units in the first Dense layer
  # Choose an optimal value between 32-512
  hp_units = hp.Int('units', min_value=32, max_value=512, step=32)
  model.add(keras.layers.Dense(units=hp_units, activation='relu'))
  model.add(keras.layers.Dense(10))

  # Tune the learning rate for the optimizer
  # Choose an optimal value from 0.01, 0.001, or 0.0001
  hp_learning_rate = hp.Choice('learning_rate', values=[1e-2, 1e-3, 1e-4])

  return model

tuner = kt.Hyperband(model_builder,
                     objective='val_accuracy',
                     max_epochs=10,
                     factor=3, #paramètre spécifique à la méthode hyperband
                     directory='my_dir',
                     project_name='intro_to_kt')

tuner.search(img_train, label_train, epochs=50, validation_split=0.2, callbacks=[stop_early])

# Get the optimal hyperparameters
best_hps=tuner.get_best_hyperparameters(num_trials=1)[0]

best_hps.get('units') #pour le nombre de neurone
best_hps.get('learning_rate') #pour le learning rate
...

# entrainement du modèle sélectionné avec les meilleurs hp
model = tuner.hypermodel.build(best_hps)
history = model.fit(img_train, label_train, epochs=50, validation_split=0.2)

# résultats des epochs calculées
val_acc_per_epoch = history.history['val_accuracy']
best_epoch = val_acc_per_epoch.index(max(val_acc_per_epoch)) + 1

from tf.keras.applications import MobileNetV2
base_model = MobileNetV2(include_top=False, # on ne charge pas les couche finales
                         weights='imagenet')

# couche  à partir de laquelle on ré-entraine les couches
fine_tune_at = 100

# on gèle les couches avant 
for layer in base_model.layers[:fine_tune_at]:
  layer.trainable = False

model.compile(loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
              optimizer = tf.keras.optimizers.adam(),
              metrics=['accuracy'])

fine_tune_epochs = 10
total_epochs =  initial_epochs + fine_tune_epochs

history_fine = model.fit(train_dataset,
                         epochs=total_epochs,
                         initial_epoch=history.epoch[-1],
                         validation_data=validation_dataset)

def plot_loss(history):
  plt.plot(history.history['loss'], label='loss')
  plt.plot(history.history['val_loss'], label='val_loss')
  plt.ylim([0, 10])
  plt.xlabel('Epoch')
  plt.ylabel('Error')
  plt.legend()
  plt.grid(True)

tensorboard_callback = tf.keras.callbacks.TensorBoard(log_dir= ...)

history = model.fit(X_train, y_train,
          validation_split=0.3,
          batch_size=16,
          epochs=100,
          callbaks = [tensorboard_callback])

from tensorflow.keras.callbacks import EarlyStopping

es = EarlyStopping()
history = model.fit(X_train, y_train,
          validation_split=0.3,
          batch_size=16,
          epochs=1000, # on peut spécifier un grand nombre d'epoch pour être sur qu'elle ne soient pas une limite
          callbacks = [es])

es = EarlyStopping(patience=20)

es = EarlyStopping(patience=20, restore_best_weights=True)

model.fit(X_train, y_train, 
          batch_size=16, 
          epochs=1000, 
          validation_split=0.3,
          callbacks=[es])

# from tensorflow.keras import regularizers, Sequential, layers

reg_l1 = regularizers.L1(0.03)
reg_l2 = regularizers.L2(0.01)
reg_l1_l2 = regularizers.l1_l2(l1=0.001, l2=0.001)

model = Sequential()

# régularisation sur le poids des neurones
model.add(layers.Dense(100, activation='relu', kernel_regularizer=reg_l1))

# régularisation sur le biais des neurones
model.add(layers.Dense(100, activation='relu', bias_regularizer=reg_l2))

# régularsisation sur la sortie de la fonction d'activation
model.add(layers.Dense(100, activation='relu', activity_regularizer=reg_l1_l2))

# dropout avec 20% de neurones éteint dans cette couche
model.add(layers.Dense(100, activation='relu'))
model.add(layers.Dropout(rate=0.2))

model.add(BatchNormalization())

# transforme le data set X_train, y_train en tenseur
X_train = tf.data.Dataset.from_tensors(X_train)
y_train = tf.data.Dataset.from_tensors(y_train)

# si vous avez des couches de pre-traitement
normalizer = tf.keras.layers.Normalization(axis=-1)
normalizer.adapt(tensor_dataset)
X_train = normalized(X_train)
y_train = normalized(y_train)

# construit le modèle (ici avec des couches denses)
model = Sequential()
model.add(layers.Dense(100, activation=..., kernel_regularizer=...))
model.add(layers.Dense(100, activation=..., bias_regularizer=...))
model.add(layers.Dense(100, activation=..., bias_regularizer=...))
...

# [Optionnel] applique des couches spécifiques (Normalisation, Drop out, Batch Normalisation)
model.add(layers.Dropout(rate=0.2))
model.add(BatchNormalization())
# régularisation sur le poids des neurones
reg_l1 = regularizers.L1(0.03)

model.add(layers.Dense(100, activation='relu', kernel_regularizer=reg_l1))

# régularisation sur le biais des neurones
reg_l2 = regularizers.L2(0.01)
model.add(layers.Dense(100, activation='relu', bias_regularizer=reg_l2))

# régularsisation sur la sortie de la fonction d'activation
reg_l1_l2 = regularizers.l1_l2(l1=0.001, l2=0.001)
model.add(layers.Dense(100, activation='relu', activity_regularizer=reg_l1_l2))

# afficher les paramètres du modèle
model.summary()

# spécifie loss, optimizer et métrique d'évaluation
model.compile(loss=...,
              optimizer= ...,
              metrics=[...])

# définition des callbacks early stopping & Tensorboard
es = EarlyStopping(min_delta=...,patience=...)
tensorboard_callback = tf.keras.callbacks.TensorBoard(log_dir= ...)

history = model.fit(X_train,y_train,
          validation_split=...,
          batch_size=16,
          epochs=..., 
          callbacks = [es, tensorboard_callback, ...])

# affiche tensorboard (dans un notebook)
%tensorboard --logdir votre_path/fit


# évaluer les performances du modèle
loss, accuracy = model.evaluate(X_test,y_test)

# sauvegarder le modele
model.save(filepath, ...)

Leçon: Workflow pour le deep learning orienté pour Tensorflow¶

Les différentes étapes¶

A partir de data set externes¶

Créer des pipelines de données (module tf.data.Dataset)¶

En utilisant les pipelines de Tensorflow¶

Exemple d'implémentation d'une couche de normalisation:¶

Exemple d'implémentation d'une couche de vectorisation de données textuelles:¶

Construction du réseau de neurone¶

Architecture du modèle¶

Choix du type de réseau¶

Le perceptron multi-couche (MLP) ou réseau dense¶

Les réseaux convolutifs ou Convolutionnal Neural Network (CNN)¶

Les réseaux récurrents ou Recurrent Neural Network (RNN)¶

Les auto-encodeurs¶

Les GAN(s)¶

Les Transformers¶

Choix des couches : type et nombre de couches, neurones par couches¶

Intuition¶

Code avec l'API Sequential de keras¶

Afficher l'architecure et les paramètres du réseau¶

Fonction d'activation¶

Exemple avec un réseau dense (MLP):¶

Optimiseur & learning rate¶

Exemple avec l'optimiseur Adam :¶

Fonction de perte (loss) : $L(\theta_1,\theta_2, \cdots \theta_i)$¶

Utilisation dans keras :¶

Métrique d'évaluation¶

Exemple avec la métrique RMSE¶

Batch size (mini-batch gradient descent)¶

Nombre d'epochs¶

Conseil¶

Prévention du sur-apprentissage (overfitting)¶

Entraînement¶

Ressources de calcul¶

Code dans tensorflow :¶

Réglages des hyper paramètres¶

Définition¶

Différents variantes d'algorithmes¶

Application dans tensorflow¶

Exemple d'une chaine de traitement avec la méthode hyperband¶

Pour aller plus loin¶

Implémentation dans tensorflow¶

Gestion du compromis biais/variance¶

Détection de l'overfitting: les courbes d'apprentissage¶

Encore mieux : utiliser Tensorboard pour le monitoring¶

Réduction de l'overfitting¶

Exemple d'implémentation :¶

Implémentation¶

Le plus simple : Via keras.model¶

De manière plus complète :¶

Récapitulatif d'un réseau basique (pseudo code)¶

Définir le réseau¶

Entrainer, évaluer et sauvegarder le réseau¶

Sources¶

Créer des pipelines de données (module `tf.data.Dataset`)¶

Code avec l'API Sequential de keras ¶

Exemple avec l'optimiseur `Adam` :¶

Exemple d'une chaine de traitement avec la méthode `hyperband`¶

Le plus simple : Via `keras.model`¶