Source code for libuplift.metrics.regression

"""Metrics to assess performance of uplift regression task

Functions named as ``*_score`` return a scalar value to maximize: the higher
the better

Function named as ``*_error`` or ``*_loss`` return a scalar value to minimize:
the lower the better
"""

import numpy as np

from sklearn.utils.validation import check_array, check_consistent_length

from ..utils.validation import check_trt

def _e_satx(y_true, y_pred, trt, n_trt=None, satt=True):
    """Generic method for e_sate and e_satt."""
    y_true = check_array(y_true, ensure_2d=False)
    y_pred = check_array(y_pred, ensure_2d=False)
    if y_pred.ndim == 1:
        y_pred = y_pred.reshape((-1, 1))
    trt, n_trt = check_trt(trt, n_trt)
    check_consistent_length(y_true, y_pred, trt)

    average_ys_true = []
    sate_pred_s = []
    nts = []
    for t in range(n_trt + 1):
        ind = (trt==t)
        nt = ind.sum()
        if nt > 0:
            av_y_t_true = np.average(y_true[ind])
            if t > 0:
                if satt:
                    sate_pred = np.average(y_pred[ind][:,t-1]) # ATT
                else:
                    sate_pred = np.average(y_pred[:,t-1]) # ATE
            else:
                sate_pred = np.nan
        else:
            av_y_t_true = np.nan
            sate_pred = np.nan
        nts.append(nt)
        average_ys_true.append(av_y_t_true)
        sate_pred_s.append(sate_pred)
    if nts[0] == 0:
        raise RuntimeError("Cannot estimate ATE. No cases in control")
    n_treated = sum(nts[1:])
    if n_treated == 0:
        raise RuntimeError("Cannot estimate ATE. No cases in any treatment")
    average_y_control = average_ys_true[0]
    sate_pred_s = sate_pred_s[1:]
    sate_true_s = [average_ys_true[t+1] - average_y_control
                       for t in range(n_trt)]
    return sum(nt/n_treated * abs(sate_pred - sate_true)
                   for nt, sate_pred, sate_true in
                   zip(nts[1:], sate_pred_s, sate_true_s))


[docs]
def e_sate(y_true, y_pred, trt, n_trt=1):
    """Absolute error on Sample Average Treatment Effect.

    Works by computing ATE using model predictions and true outcomes.
    Absolute value of the difference between the two values is returned.

    For multiple treatments, return weighted average.  This measure is
    not very effective.
    """
    return _e_satx(y_true, y_pred, trt, n_trt=n_trt, satt=False)


[docs]
def e_satt(y_true, y_pred, trt, n_trt=1):
    """Absolute error on Sample Average Treatment Effect on the Treated.

    Works by computing ATT using model predictions and true outcomes.
    Absolute value of the difference between the two values is returned.

    For multiple treatments, return weighted average.  This measure is
    not very effective.
    """
    return _e_satx(y_true, y_pred, trt, n_trt=n_trt, satt=True)



[docs]
def sim_gain_at(y_true, y_pred, trt, n_trt=None, *, quantile=0.5):
    """Simulated on-policy gains at given quantile of targeted
    population.

    For mulitple treatments, the most beneficial treatment of each
    case is selected.  Enough data must be present in all treatments
    for the measure to be well defined.
    """
    y_true = check_array(y_true, ensure_2d=False)
    y_pred = check_array(y_pred, ensure_2d=False)
    if y_pred.ndim == 1:
        y_pred = y_pred.reshape((-1, 1))
    trt, n_trt = check_trt(trt, n_trt)
    check_consistent_length(y_true, y_pred, trt)

    best_treatment = y_pred.argmax(axis=1)
    best_gain = y_pred[:,best_treatment]
    
    
    average_ys_true = []
    sate_pred_s = []
    nts = []
    for t in range(n_trt + 1):
        ind = (trt==t)
        nt = ind.sum()
        if nt > 0:
            av_y_t_true = np.average(y_true[ind])
            if t > 0:
                if satt:
                    sate_pred = np.average(y_pred[ind][:,t-1]) # ATT
                else:
                    sate_pred = np.average(y_pred[:,t-1]) # ATE
            else:
                sate_pred = np.nan
        else:
            av_y_t_true = np.nan
            sate_pred = np.nan
        nts.append(nt)
        average_ys_true.append(av_y_t_true)
        sate_pred_s.append(sate_pred)
    if nts[0] == 0:
        raise RuntimeError("Cannot estimate ATE. No cases in control")
    n_treated = sum(nts[1:])
    if n_treated == 0:
        raise RuntimeError("Cannot estimate ATE. No cases in any treatment")
    average_y_control = average_ys_true[0]
    sate_pred_s = sate_pred_s[1:]
    sate_true_s = [average_ys_true[t+1] - average_y_control
                       for t in range(n_trt)]
    return sum(nt/n_treated * abs(sate_pred - sate_true)
                   for nt, sate_pred, sate_true in
                   zip(nts[1:], sate_pred_s, sate_true_s))



[docs]
def sim_gain(y_true, y_pred, trt, n_trt=None, *, quantile=0.5):
    """Simulated on-policy gains for the whole population.
    """
    return sim_gain_at(y_true, y_pred, trt, n_trt=None, quantile=1.1)