# !{sys.executable} -m pip install -U pandas-profiling[notebook]
# !jupyter nbextension enable --py widgetsnbextension
files = {
#"references_amendements_plfss_2020-2021" : "https://github.com/leximpact/donnees-extraites-assemblee/raw/main/references_amendements_plfss_2020-2021.csv",
#"references_amendements_affaires_sociales" : "https://github.com/leximpact/donnees-extraites-assemblee/raw/main/references_amendements_affaires_sociales.csv"
"references_articles_amendes_plfss_2020-2021" : "https://github.com/leximpact/donnees-extraites-assemblee/raw/main/references_articles_amendes_plfss_2020-2021.csv"
}
for k in files.keys():
print(k, files.get(k))
df = load_data(files.get(k))
df["law_article"] = df.law + ' article ' + df.article
#df.law_article.value_counts().to_frame().to_csv(k + '-top-article.csv')
profile = ProfileReport(df, title='Pandas Profiling Report', explorative=True)
profile
display_distinct(df)
df.head()
import numpy as np
for y in df.year.unique():
if np.isnan(y):
continue
y = int(y)
print(y)
df_tmp = df.query("year == @y")["law_article"]
df_tmp.value_counts().to_frame().head(5)
df_tmp.value_counts().to_frame().to_csv(f'{k}-{y}-top-article.csv')
df.columns
df_soutiens = df.groupby(by="law_article").sum()
df_soutiens.drop(["year", "section1"], inplace=True, axis=1)
df_soutiens["amendements_Signataire_Total"] = df_soutiens['amendements1Signataire'] \
+ df_soutiens['amendementsMoins10Signataires'] + df_soutiens['amendementsPlus10Signataires']
df_soutiens = df_soutiens.sort_values(by=['amendements_Signataire_Total', 'amendementsPlus10Signataires', 'amendementsMoins10Signataires'], ascending=False)
df_soutiens
df_soutiens.to_excel(k + '-amendements_signataires.xlsx')
TODO
- Adoptés par parti
- Article par année
- Adoptés par article
- Il nous faut également analyser les articles de lois “modifiés” par le PLFSS. Sous deux dimensions : identifier les articles du PLFSS les plus amendés. Pour chaque article, donner le nombre d’amendements, en précisant le pourcentage d’amendements de plus de 10 signatures, et le pourcentage d’amendement d’une seule signature. (Ces deux scores venant potentiellement surclasser ou déclasser l’article en termes d’importance).
- Sortir les la liste des textes de lois modifiés par l’article du PLFSS