Metodo append()

Combina le righe di due o più dataframe in un unico dataframe aggiungendo un dataframe alla fine di un altro dataframe.

Sintassi

dataframe_1_name.append([dataframe_2_name, dataframe_3_name, ...n], common_columns_only = True|False, all_chars = True|False)

Parametri

Nome Descrizione
dataframe_2_name, dataframe_3_name, ...n

Il dataframe o i dataframe da aggiungere.

I dataframe vengono aggiunti nell'ordine in cui vengono specificati. Il dataframe di output contiene le righe del dataframe_1, seguite dalle righe del dataframe_2 e così via.

I dataframe di origine possono avere colonne diverse o identiche.

common_columns_only = True | False
  • True (Vero): nel dataframe di output vengono incluse solo le colonne comuni a tutti i dataframe aggiunti.

    Le colonne del dataframe sono considerate comuni se hanno un nome identico.

  • False (Falso): tutte le colonne di tutti i dataframe sono incluse nel dataframe di output. I valori NaN vengono visualizzati nel dataframe di output laddove non esiste alcuna colonna nel dataframe di origine.
all_chars = True | False
  • True (Vero): in tutti i dataframe aggiunti al tipo di dati stringa vengono convertite tutte le colonne non carattere.

    Questa conversione globale in dati stringa garantisce che tutte le colonne con nome identico vengano aggiunte senza errori.

  • False (Falso): il tipo di dati delle colonne non carattere nei dataframe aggiunti rimane invariato.

Restituisce

Dataframe HCL.

Esempi

Aggiungere dataframe con strutture di dati identiche

Si aggiungono i dataframe Trans_Jan, Trans_Feb e Trans_Mar in un singolo dataframe denominato Trans_Q1 che include tutte le righe dei tre dataframe di origine.

Tutti i dataframe di origine hanno un set identico di colonne, quindi non ha importanza se si specifica True (Vero) o False (Falso) per common_columns_only.

Trans_Q1 = Trans_Jan.append([Trans_Feb, Trans_Mar], common_columns_only = False, all_chars = False)

Aggiungere dataframe con strutture di dati diverse

Sono presenti dataframe separati contenenti dati sui dipendenti provenienti da diverse divisioni di una società. Per poter effettuare delle analisi, è necessario che tutti i dati dei dipendenti siano in un unico dataframe. La maggior parte delle colonne sono le stesse in tutti i dataframe, ma alcune colonne non necessarie per l'analisi sono esclusive dei singoli dataframe.

Si utilizza common_columns_only per specificare che nel dataframe di output vengano incluse solo le colonne che sono uguali in tutti i dataframe. Se una colonna non è presente in uno solo dei dataframe, viene omessa dall'output.

Employees_All = Employees_HQ.append([Employees_West, Employees_South], common_columns_only = True, all_chars = False)