Skip to content

OSM-Catalan/toponimsCat

Repository files navigation

toponimsCat: Topònims en català a l’OpenStreetMap

Eines per ajudar a afegir l’etiqueta name:ca i alt_name:ca. A la carpeta exec/ hi ha scripts d’R per generar i actualitzar els fitxers de diferents projectes. A la carpeta PPCC/ i exotopònims/ hi ha les dades dels diferents projectes de localització. Per descarregar i pujar les dades a OpenstreetMap, cal instal·lar LangToolsOSM.

Resum de l’estat dels projectes

Objectes Revisions Objectes amb nom de wikidata Revisions amb nom de wikidata Objectes editats Revisions editades Objectes amb nom de wikidata editats Revisions amb nom de wikidata editades
exotopònims/Rússia/estat_wikidata.csv 1846 1582 1846 1582 1735 1196 1735 1196
PPCC/avenida-avinguda/casos_comarques.csv 2510 709 2 2 947 227 0 0
PPCC/calle-carrer/casos_comarques.csv 6306 4096 0 0 12461 7393 0 0
PPCC/camino-camí/casos_comarques.csv 1960 882 0 0 101 61 0 0
PPCC/correccions-name:ca/casos_comarques.csv 6 3 0 0 224 129 1 1
PPCC/name-name:ca/casos_municipis.csv 353762 270075 3292 2940 441694 235802 4653 2474
PPCC/parque-parc/casos_comarques.csv 732 623 1 1 37 34 0 0
PPCC/plaza-plaça/casos_comarques.csv 1351 798 3 3 343 192 0 0

Número de casos pendents d’afegir l’etiqueta «name:ca» i número de casos editats per cada projecte. Per projectes sense revisió unificada, pot haver-hi casos duplicats en fitxers diferents.

Estructura de fitxers d’un projecte

  • informes Conté fitxers d’informes amb tots els objectes d’OSM segons el filtre i àrea del projecte.
  • revisions Conté fitxers de revisions amb combinacions úniques de les etiquetes «name», «name:ca», «alt_name:ca», «alt_name», «translations», «ca.wikipedia_page» i «wikidata_id». Aquests fitxers són els que cal revisar abans de preparar les edicions que es carregaran a OSM. Els fitxers revisats s’han de moure a revisions/FET i són els més valuoso, ja que inclouen la feina humana de revisar tots els casos, i per això té sentit afegir-los al repositori git.
  • edicions Conté fitxers d’informes amb els valors nous dels camps «name:ca» i «alt_name:ca» a punt per carregar a OSM, generats a partir dels informes i revisions fetes (fitxers a revisions/FET).

Flux de treball i ús de les funcions principals

  1. generaInforme / generaInformesPPCC: retorna ordres per generar informes que es desaran a la carpeta informes.
  2. recompteCasosInformes: Recompta el nombre de casos i traduccions dels informes. És optatiu, ja que no modifica res.
  3. generaRevisions_regexName / generaRevisions_regexTranslations: desa els fitxers de revisions a la carpeta revisions i omple els camps «name:ca» i «alt_name:ca» segons regles i expressions regulars.
  4. preparaEdicions: combina informes i revisions per generar els fitxers amb les edidions a la carpeta edicions a punt per carregar a OSM.
  5. actualitzaInformesCarregats: arxiva les edicions carregades i actualitza o elimina els informes desactualitzats.

Exemples

Podeu veure un exemple de projecte per afegir l’etiqueta «name:ca» a carrers dels PPCC que tenen l’etiqueta «name» començada amb «[Cc]alle» a PPCC/calle-carrer. No és necessari desar tots els fitxers a git, però aquest projecte els inclou a tall d’exemple. També podeu consultar el codi per generar i actualitzar el projecte.

Com col·laborar?

La part que requereix més feina és la revisió de les etiquetes «name:ca» i «alt_name:ca» proposades (fitxers de les carpetes revisions dels diferents projectes). Si voleu encarregar-vos d’algun país en concret o algun tipus d’objecte als PPCC i no us en sortiu en generar els fitxers, obriu un tiquet i miraré de generar-los.

També en podem parlar als espais de la comunitat OpenStreetMap en Català.

Com buscar projectes amb feina pendent?

Consulteu a Overpass. Exemple de consulta per objectes amb etiqueta «name» que comenci amb «[Pp]uente» i no tinguin etiqueta «name:ca»:

[out:json][timeout:250];
{{geocodeArea:Països Catalans}}->.searchArea;
(
  nwr[!'name:ca']['name'~'^[Pp]uente '](area.searchArea);
);
out body;
>;
out skel qt;

Instal·lació del paquet d’R

Podeu descarregar l’última versió del paquet (fitxer toponimsCat_X.Y.tar.gz) i instal·lar-lo amb:

install.packages("toponimsCat_X.Y.tar.gz", repos=NULL)

Podeu instal·lar la versió en desenvolupament de toponimsCat des de GitHub amb:

# install.packages("remotes")
remotes::install_github("OSM-Catalan/toponimsCat")

Visualitza les diferències amb git dels fitxers .tsv

Assegureu-vos que teniu git-lfs instal·lat.

git config --global diff.lfstext.textconv cat

De https://github.com/git-lfs/git-lfs/blob/main/docs/man/git-lfs-faq.adoc

Enllaços d’interès