d3/d11/ambiguity__solver__network_8py_source.html

import pandas as pd

import numpy as np


import torch.nn as nn

import torch.nn.functional as F

import torch.utils


import ast


def prepareDataSet(data: pd.DataFrame) -> pd.DataFrame:

    """Format the dataset that have been written from the Csv file"""

    """

    @param[in] data: input DataFrame containing 1 event

    @return: Formatted DataFrame

    """

    data = data

    # Remove tracks with less than 7 measurements

    data = data[data["nMeasurements"] > 6]

    data = data.sort_values("good/duplicate/fake", ascending=False)

    # Remove pure duplicate (tracks purely identical) keep the ones good one if among them.

    data = data.drop_duplicates(

        subset=[

            "particleId",

            "Hits_ID",

            "nOutliers",

            "nHoles",

            "nSharedHits",

            "chi2",

        ],

        keep="first",

    )

    data = data.sort_values("particleId")

    # Set truth particle ID as index

    data = data.set_index("particleId")

    # Transform the hit list from a string to an actual list

    hitsIds = []

    mergedIds = []

    for list in data["Hits_ID"].values:

        hitsIds.append(ast.literal_eval(list))

    data["Hits_ID"] = hitsIds

    # Combine dataset

    return data


class DuplicateClassifier(nn.Module):

    """MLP model used to separate good tracks from duplicate tracks. Return one score per track the higher one correspond to the good track."""


    def __init__(self, input_dim, n_layers):

        """Three layer MLP, 20% dropout, sigmoid activation for the last layer."""

        super(DuplicateClassifier, self).__init__()

        self.linear1 = nn.Linear(input_dim, n_layers[0])

        self.linear2 = nn.Linear(n_layers[0], n_layers[1])

        self.linear3 = nn.Linear(n_layers[1], n_layers[2])

        self.output = nn.Linear(n_layers[2], 1)

        self.sigmoid = nn.Sigmoid()


    def forward(self, z):

        z = F.relu(self.linear1(z))

        z = F.relu(self.linear2(z))

        z = F.relu(self.linear3(z))

        return self.sigmoid(self.output(z))


class Normalise(nn.Module):

    """Normalisation of the input before the MLP model."""


    def __init__(self, mean, std):

        super(Normalise, self).__init__()

        self.mean = torch.tensor(mean, dtype=torch.float32)

        self.std = torch.tensor(std, dtype=torch.float32)


    def forward(self, z):

        z = z - self.mean

        z = z / self.std

        return z