Source code for lczerolens.lenses.lrp.rules.epsilon

"""Function classes to apply the LRP rules to the layers of the network.

Classes
-------
ElementwiseMultiplyUniform
    Distribute the relevance 100% to the input
SoftmaxEpsilon
    Softmax with epsilon.
MatrixMultiplicationEpsilon
    Matrix multiplication with epsilon.
"""

import torch
import torch.nn.functional as F
from torch.autograd import Function



[docs]
def stabilize(tensor, epsilon=1e-6):
    return tensor + epsilon * ((-1) ** (tensor < 0))




[docs]
class AddEpsilonFunction(Function):
    @staticmethod

[docs]
    def forward(ctx, input_a, input_b, epsilon=1e-6):
        output = input_a + input_b
        ctx.save_for_backward(input_a, input_b, output, torch.tensor(epsilon))
        return output


    @staticmethod

[docs]
    def backward(ctx, *grad_output):
        input_a, input_b, output, epsilon = ctx.saved_tensors
        out_relevance = grad_output[0] / stabilize(output, epsilon)
        return out_relevance * input_a, out_relevance * input_b, None





[docs]
class AddEpsilon(torch.nn.Module):
    def __init__(self, epsilon=1e-6):
        super().__init__()

[docs]
        self.epsilon = epsilon



[docs]
    def forward(self, x, y):
        return AddEpsilonFunction.apply(x, y, self.epsilon)





[docs]
class MatMulEpsilonFunction(Function):
    @staticmethod

[docs]
    def forward(ctx, input, param, epsilon=1e-6):
        output = torch.matmul(input, param)
        ctx.save_for_backward(input, param, output, torch.tensor(epsilon))

        return output


    @staticmethod

[docs]
    def backward(ctx, *grad_outputs):
        input, param, output, epsilon = ctx.saved_tensors
        out_relevance = grad_outputs[0]

        out_relevance = out_relevance / stabilize(output, epsilon)
        relevance = (out_relevance @ param.T) * input
        return relevance, None, None





[docs]
class MatMulEpsilon(torch.nn.Module):
    def __init__(self, epsilon=1e-6):
        super().__init__()

[docs]
        self.epsilon = epsilon



[docs]
    def forward(self, x, y):
        return MatMulEpsilonFunction.apply(x, y, self.epsilon)





[docs]
class BilinearMatMulEpsilonFunction(Function):
    @staticmethod

[docs]
    def forward(ctx, input_a, input_b, epsilon=1e-6):
        outputs = torch.matmul(input_a, input_b)
        ctx.save_for_backward(input_a, input_b, outputs, torch.tensor(epsilon))

        return outputs


    @staticmethod

[docs]
    def backward(ctx, *grad_outputs):
        input_a, input_b, outputs, epsilon = ctx.saved_tensors
        out_relevance = grad_outputs[0]

        out_relevance = out_relevance / stabilize(2 * outputs, epsilon)

        relevance_a = torch.matmul(out_relevance, input_b.permute(0, 1, -1, -2)) * input_a
        relevance_b = torch.matmul(input_a.permute(0, 1, -1, -2), out_relevance) * input_b

        return relevance_a, relevance_b, None





[docs]
class BilinearMatMulEpsilon(torch.nn.Module):
    def __init__(self, epsilon=1e-6):
        super().__init__()

[docs]
        self.epsilon = epsilon



[docs]
    def forward(self, x, y):
        return BilinearMatMulEpsilonFunction.apply(x, y, self.epsilon)





[docs]
class MulUniformFunction(Function):
    @staticmethod

[docs]
    def forward(ctx, input_a, input_b):
        return input_a * input_b


    @staticmethod

[docs]
    def backward(ctx, *grad_outputs):
        relevance = grad_outputs[0] * 0.5

        return relevance, relevance





[docs]
class MulUniform(torch.nn.Module):

[docs]
    def forward(self, x, y):
        return MulUniformFunction.apply(x, y)





[docs]
class SoftmaxEpsilonFunction(Function):
    @staticmethod

[docs]
    def forward(ctx, inputs, dim):
        outputs = F.softmax(inputs, dim=dim)
        ctx.save_for_backward(inputs, outputs)

        return outputs


    @staticmethod

[docs]
    def backward(ctx, *grad_outputs):
        inputs, output = ctx.saved_tensors

        relevance = (grad_outputs[0] - (output * grad_outputs[0].sum(-1, keepdim=True))) * inputs

        return (relevance, None)