/spip/ecrire/urls/arbo.php
PHP | 468 lines | 279 code | 65 blank | 124 comment | 71 complexity | e585e76980f4c8fd3e376a7aacacfb64 MD5 | raw file
Possible License(s): LGPL-2.1, GPL-3.0
- <?php
- /***************************************************************************\
- * SPIP, Systeme de publication pour l'internet *
- * *
- * Copyright (c) 2001-2011 *
- * Arnaud Martin, Antoine Pitrou, Philippe Riviere, Emmanuel Saint-James *
- * *
- * Ce programme est un logiciel libre distribue sous licence GNU/GPL. *
- * Pour plus de details voir le fichier COPYING.txt ou l'aide en ligne. *
- \***************************************************************************/
- if (!defined('_ECRIRE_INC_VERSION')) return;
- define('URLS_ARBO_EXEMPLE', '/article/titre');
- // TODO: une interface permettant de verifier qu'on veut effectivment modifier
- // une adresse existante
- define('CONFIRMER_MODIFIER_URL', false);
- /**
- * - Comment utiliser ce jeu d'URLs ?
- * Recopiez le fichier "htaccess.txt" du repertoire de base du site SPIP sous
- * le sous le nom ".htaccess" (attention a ne pas ecraser d'autres reglages
- * que vous pourriez avoir mis dans ce fichier) ; si votre site est en
- * "sous-repertoire", vous devrez aussi editer la ligne "RewriteBase" ce fichier.
- * Les URLs definies seront alors redirigees vers les fichiers de SPIP.
- *
- * Choisissez "arbo" dans les pages de configuration d'URL
- *
- * SPIP calculera alors ses liens sous la forme "Mon-titre-d-article".
- * Variantes :
- *
- * Terminaison :
- * les terminaisons ne *sont pas* stockees en base, elles servent juste
- * a rendre les url jolies ou conformes a un usage
- * pour avoir des url terminant par html
- * define ('_terminaison_urls_arbo', '.html');
- *
- * pour preciser des terminaisons particulieres pour certains types
- * $GLOBALS['url_arbo_terminaisons']=array(
- * 'rubrique' => '/',
- * 'mot' => '',
- * 'groupe' => '/',
- * 'defaut' => '.html');
- *
- * pour avoir des url numeriques (id) du type 12/5/4/article/23
- * define ('_URLS_ARBO_MIN',255);
- *
- *
- * pour conserver la casse des titres dans les url
- * define ('_url_arbo_minuscules',0);
- *
- * pour choisir le caractere de separation titre-id en cas de doublon
- * (ne pas utiliser '/')
- * define ('_url_arbo_sep_id','-');
- *
- * pour modifier la hierarchie apparente dans la constitution des urls
- * ex pour que les mots soient classes par groupes
- * $GLOBALS['url_arbo_parents']=array(
- * 'article'=>array('id_rubrique','rubrique'),
- * 'rubrique'=>array('id_parent','rubrique'),
- * 'breve'=>array('id_rubrique','rubrique'),
- * 'site'=>array('id_rubrique','rubrique'),
- * 'mot'=>array('id_groupe','groupes_mot'));
- *
- * pour personaliser les types
- * $GLOBALS['url_arbo_types']=array(
- * 'rubrique'=>'', // pas de type pour les rubriques
- * 'article'=>'a',
- * 'mot'=>'tags'
- * );
- *
- */
- define ('_debut_urls_arbo', '');
- define ('_terminaison_urls_arbo', '');
- define ('_url_arbo_sep_id','-');
- define ('_url_arbo_minuscules',1);
- // Ces chaines servaient de marqueurs a l'epoque ou les URL propres devaient
- // indiquer la table ou les chercher (articles, auteurs etc),
- // et elles etaient retirees par les preg_match dans la fonction ci-dessous.
- // Elles sont a present definies a "" pour avoir des URL plus jolies
- // mais les preg_match restent necessaires pour gerer les anciens signets.
- #define('_MARQUEUR_URL', serialize(array('rubrique1' => '-', 'rubrique2' => '-', 'breve1' => '+', 'breve2' => '+', 'site1' => '@', 'site2' => '@', 'auteur1' => '_', 'auteur2' => '_', 'mot1' => '+-', 'mot2' => '-+')));
- define('_MARQUEUR_URL', false);
- function url_arbo_parent($type){
- static $parents = null;
- if (is_null($parents)){
- $parents = array(
- 'article'=>array('id_rubrique','rubrique'),
- 'rubrique'=>array('id_parent','rubrique'),
- 'breve'=>array('id_rubrique','rubrique'),
- 'site'=>array('id_rubrique','rubrique'));
- if (isset($GLOBALS['url_arbo_parents']) AND !isset($_REQUEST['url_arbo_parents'])){
- $parents = array_merge($parents,$GLOBALS['url_arbo_parents']);
- }
- }
- return (isset($parents[$type])?$parents[$type]:'');
- }
- function url_arbo_terminaison($type){
- static $terminaison_types = null;
- if ($terminaison_types==null){
- $terminaison_types = array('rubrique' => '/','mot' => '','defaut' => defined('_terminaison_urls_arbo')?_terminaison_urls_arbo:'.html');
- if (isset($GLOBALS['url_arbo_terminaisons']))
- $terminaison_types = array_merge($terminaison_types,$GLOBALS['url_arbo_terminaisons']);
- }
- // si c'est un appel avec type='' c'est pour avoir la liste des terminaisons
- if (!$type)
- return array_unique(array_values($terminaison_types));
- if (isset($terminaison_types[$type]))
- return $terminaison_types[$type];
- elseif (isset($terminaison_types['defaut']))
- return $terminaison_types['defaut'];
- return "";
- }
- function url_arbo_type($type){
- // par defaut les rubriques ne sont pas typees, mais le reste oui
- static $synonymes_types = null;
- if (!$synonymes_types){
- $synonymes_types = array('rubrique'=>'');
- if (isset($GLOBALS['url_arbo_types']) AND is_array($GLOBALS['url_arbo_types']))
- $synonymes_types = array_merge($synonymes_types,$GLOBALS['url_arbo_types']);
- }
- // si c'est un appel avec type='' c'est pour avoir la liste inversee des synonymes
- if (!$type)
- return array_flip($synonymes_types);
- return
- ($t=(isset($synonymes_types[$type])?$synonymes_types[$type]:$type)) // le type ou son synonyme
- . ($t?'/':''); // le / eventuel pour separer, si le synonyme n'est pas vide
- }
- // Pipeline pour creation d'une adresse : il recoit l'url propose par le
- // precedent, un tableau indiquant le titre de l'objet, son type, son id,
- // et doit donner en retour une chaine d'url, sans se soucier de la
- // duplication eventuelle, qui sera geree apres
- // http://doc.spip.org/@creer_chaine_url
- function urls_arbo_creer_chaine_url($x) {
- // NB: ici url_old ne sert pas, mais un plugin qui ajouterait une date
- // pourrait l'utiliser pour juste ajouter la
- $url_old = $x['data'];
- $objet = $x['objet'];
- include_spip('inc/filtres');
- if (!defined('_URLS_ARBO_MAX')) define('_URLS_ARBO_MAX', 35);
- if (!defined('_URLS_ARBO_MIN')) define('_URLS_ARBO_MIN', 3);
- include_spip('action/editer_url');
- if (!$url = url_nettoyer($objet['titre'],_URLS_ARBO_MAX,_URLS_ARBO_MIN,'-',_url_arbo_minuscules?'strtolower':''))
- $url = $objet['id_objet'];
-
- $x['data'] =
- url_arbo_type($objet['type']) // le type ou son synonyme
- . $url; // le titre
- return $x;
- }
- // http://doc.spip.org/@declarer_url_arbo_rec
- function declarer_url_arbo_rec($url,$type,$parent,$type_parent){
- if (is_null($parent)){
- return $url;
- }
- if($parent==0)
- return rtrim($url,'/');
- else {
- $url_parent = declarer_url_arbo($type_parent?$type_parent:'rubrique',$parent);
- return rtrim($url_parent,'/') . '/' . rtrim($url,'/');
- }
- }
- // http://doc.spip.org/@declarer_url_arbo
- function declarer_url_arbo($type, $id_objet) {
- static $urls=array();
-
- // Se contenter de cette URL si elle existe ;
- // sauf si on invoque par "voir en ligne" avec droit de modifier l'url
- // l'autorisation est verifiee apres avoir calcule la nouvelle url propre
- // car si elle ne change pas, cela ne sert a rien de verifier les autorisations
- // qui requetent en base
- $modifier_url = $GLOBALS['var_urls'];
-
- if (!isset($urls[$type][$id_objet]) OR $modifier_url) {
- $trouver_table = charger_fonction('trouver_table', 'base');
- $desc = $trouver_table(table_objet($type));
- $champ_titre = $desc['titre'];
- $col_id = @$desc['key']["PRIMARY KEY"];
- // $type doit designer une table, avec champ indiquant un titre
- if (!$col_id OR !$champ_titre) return false;
- $table = $desc['table'];
- $id_objet = intval($id_objet);
-
- // parent
- $champ_parent = url_arbo_parent($type);
- $sel_parent = ($champ_parent)?", O.".reset($champ_parent).' as parent':'';
-
- // Recuperer une URL propre correspondant a l'objet.
- $row = sql_fetsel("U.url, U.date, O.$champ_titre $sel_parent", "$table AS O LEFT JOIN spip_urls AS U ON (U.type='$type' AND U.id_objet=O.$col_id)", "O.$col_id=$id_objet", '', 'U.date DESC', 1);
- if ($row){
- $urls[$type][$id_objet] = $row;
- $urls[$type][$id_objet]['type_parent'] = $champ_parent?end($champ_parent):'';
- }
- }
- if (!isset($urls[$type][$id_objet])) return ""; # objet inexistant
- $url_propre = $urls[$type][$id_objet]['url'];
- if (!is_null($url_propre) AND !$modifier_url)
- return declarer_url_arbo_rec($url_propre,$type,
- isset($urls[$type][$id_objet]['parent'])?$urls[$type][$id_objet]['parent']:null,
- isset($urls[$type][$id_objet]['type_parent'])?$urls[$type][$id_objet]['type_parent']:null);
- // Sinon, creer une URL
- $url = pipeline('arbo_creer_chaine_url',
- array(
- 'data' => $url_propre, // le vieux url_propre
- 'objet' => array_merge($urls[$type][$id_objet],
- array('type' => $type, 'id_objet' => $id_objet)
- )
- )
- );
- // Eviter de tamponner les URLs a l'ancienne (cas d'un article
- // intitule "auteur2")
- include_spip('inc/urls');
- $objets = urls_liste_objets();
- if (preg_match(',^('.$objets.')[0-9]*$,', $url, $r)
- AND $r[1] != $type)
- $url = $url._url_arbo_sep_id.$id_objet;
- // Pas de changement d'url
- if ($url == $url_propre)
- return declarer_url_arbo_rec($url_propre,$type,$urls[$type][$id_objet]['parent'],$urls[$type][$id_objet]['type_parent']);
-
- // verifier l'autorisation, maintenant qu'on est sur qu'on va agir
- if ($modifier_url) {
- include_spip('inc/autoriser');
- $modifier_url = autoriser('modifierurl', $type, $id_objet);
- }
- // Verifier si l'utilisateur veut effectivement changer l'URL
- if ($modifier_url
- AND CONFIRMER_MODIFIER_URL
- AND $url_propre
- AND $url != preg_replace('/,.*/', '', $url_propre))
- $confirmer = true;
- else
- $confirmer = false;
- if ($confirmer AND !_request('ok')) {
- die ("vous changez d'url ? $url_propre -> $url");
- }
- $set = array('url' => $url, 'type' => $type, 'id_objet' => $id_objet);
- include_spip('action/editer_url');
- if (url_insert($set,$confirmer,_url_arbo_sep_id)){
- $urls[$type][$id_objet]['url'] = $set['url'];
- }
- else {
- // l'insertion a echoue,
- //serveur out ? retourner au mieux
- $urls[$type][$id_objet]['url']=$url_propre;
- }
- return declarer_url_arbo_rec($urls[$type][$id_objet]['url'],$type,$urls[$type][$id_objet]['parent'],$urls[$type][$id_objet]['type_parent']);
- }
- // http://doc.spip.org/@_generer_url_arbo
- function _generer_url_arbo($type, $id, $args='', $ancre='') {
- if ($generer_url_externe = charger_fonction("generer_url_$type",'urls',true)) {
- $url = $generer_url_externe($id, $args, $ancre);
- if (NULL != $url) return $url;
- }
- if ($type == 'document') {
- include_spip('inc/documents');
- return generer_url_document_dist($id, $args, $ancre);
- }
- // Mode propre
- $propre = declarer_url_arbo($type, $id);
- if ($propre === false) return ''; // objet inconnu. raccourci ?
- if ($propre) {
- $url = _debut_urls_arbo
- . rtrim($propre,'/')
- . url_arbo_terminaison($type);
- } else {
- // objet connu mais sans possibilite d'URL lisible, revenir au defaut
- include_spip('base/connect_sql');
- $id_type = id_table_objet($type);
- $url = get_spip_script('./')."?"._SPIP_PAGE."=$type&$id_type=$id";
- }
- // Ajouter les args
- if ($args)
- $url .= ((strpos($url, '?')===false) ? '?' : '&') . $args;
- // Ajouter l'ancre
- if ($ancre)
- $url .= "#$ancre";
- return _DIR_RACINE . $url;
- }
- // @return array([contexte],[type],[url_redirect],[fond]) : url decodee
- // http://doc.spip.org/@urls_arbo_dist
- function urls_arbo_dist($i, $entite, $args='', $ancre='') {
- if (is_numeric($i))
- return _generer_url_arbo($entite, $i, $args, $ancre);
- // traiter les injections du type domaine.org/spip.php/cestnimportequoi/ou/encore/plus/rubrique23
- if ($GLOBALS['profondeur_url']>0 AND $entite=='sommaire'){
- $entite = 'type_urls';
- }
- // recuperer les &debut_xx;
- if (is_array($args))
- $contexte = $args;
- else
- parse_str($args,$contexte);
- $url = $i;
- $id_objet = $type = 0;
- $url_redirect = null;
- // Migration depuis anciennes URLs ?
- // traiter les injections domain.tld/spip.php/n/importe/quoi/rubrique23
- if ($GLOBALS['profondeur_url']<=0
- AND $_SERVER['REQUEST_METHOD'] != 'POST') {
- include_spip('inc/urls');
- $r = nettoyer_url_page($i, $contexte);
- if ($r) {
- list($contexte, $type,,, $suite) = $r;
- $_id = id_table_objet($type);
- $id_objet = $contexte[$_id];
- $url_propre = generer_url_entite($id_objet, $type);
- if (strlen($url_propre)
- AND !strstr($url,$url_propre)) {
- list(,$hash) = explode('#', $url_propre);
- $args = array();
- foreach(array_filter(explode('&', $suite)) as $fragment) {
- if ($fragment != "$_id=$id_objet")
- $args[] = $fragment;
- }
- $url_redirect = generer_url_entite($id_objet, $type, join('&',array_filter($args)), $hash);
- return array($contexte, $type, $url_redirect, $type);
- }
- }
- }
- /* Fin compatibilite anciennes urls */
- // Chercher les valeurs d'environnement qui indiquent l'url-propre
- if (isset($_SERVER['REDIRECT_url_propre']))
- $url_propre = $_SERVER['REDIRECT_url_propre'];
- elseif (isset($_ENV['url_propre']))
- $url_propre = $_ENV['url_propre'];
- else {
- // ne prendre que le segment d'url qui correspond, en fonction de la profondeur calculee
- $url = ltrim($url,'/');
- $url = explode('/',$url);
- while (count($url)>$GLOBALS['profondeur_url']+1)
- array_shift($url);
- $url = implode('/',$url);
- $url_propre = preg_replace(',[?].*,', '', $url);
- }
- // Mode Query-String ?
- if (!$url_propre
- AND preg_match(',[?]([^=/?&]+)(&.*)?$,', $url, $r)) {
- $url_propre = $r[1];
- }
- if (!$url_propre) return; // qu'est-ce qu'il veut ???
-
- include_spip('base/abstract_sql'); // chercher dans la table des URLS
- // Revenir en utf-8 si encodage type %D8%A7 (farsi)
- $url_propre = rawurldecode($url_propre);
- // Compatibilite avec .htm/.html et autres terminaisons
- $t = array_diff(array_unique(array_merge(array('.html','.htm','/'),url_arbo_terminaison(''))),array(''));
- if (count($t))
- $url_propre = preg_replace('{('
- .implode('|',array_map('preg_quote',$t)).')$}i', '', $url_propre);
- if (strlen($url_propre) AND !preg_match(',^[^/]*[.]php,',$url_propre)){
- $types_parents = array();
-
- // recuperer tous les objets de larbo xxx/article/yyy/mot/zzzz
- $url_arbo = explode('/',$url_propre);
- while (count($url_arbo)>0){
- $url_propre = array_pop($url_arbo);
- if (count($url_arbo))
- $type = array_pop($url_arbo);
- else
- $type=null;
- // Compatibilite avec les anciens marqueurs d'URL propres
- // Tester l'entree telle quelle (avec 'url_libre' des sites ont pu avoir des entrees avec marqueurs dans la table spip_urls)
- if (is_null($type)
- OR !$row=sql_fetsel('id_objet, type, date', 'spip_urls',array('url='.sql_quote("$type/$url_propre")))) {
- if (!is_null($type))
- array_push($url_arbo,$type);
- $row = sql_fetsel('id_objet, type, date', 'spip_urls',array('url='.sql_quote($url_propre)));
- }
- if ($row) {
- $type = $row['type'];
- $col_id = id_table_objet($type);
-
- // n'affecter que la premiere fois un parent de type id_rubrique
- if (!isset($contexte[$col_id]))
- $contexte[$col_id] = $row['id_objet'];
- if (!$entite
- OR !in_array($type,$types_parents))
- $entite = $type;
-
- if ($p = url_arbo_parent($type))
- $types_parents[]=end($p);
- }
- else {
- // un segment est inconnu
- if ($entite=='' OR $entite=='type_urls') {
- // on genere une 404 comme il faut si on ne sait pas ou aller
- return array(array(),'404');
- }
- return; // ?
- }
- }
- // gerer le retour depuis des urls propres
- if (($entite=='' OR $entite=='type_urls')
- AND $GLOBALS['profondeur_url']<=0){
- $urls_anciennes = charger_fonction('propres','urls');
- return $urls_anciennes($url_propre, $entite, $contexte);
- }
- }
- if ($entite=='' OR $entite=='type_urls' /* compat .htaccess 2.0 */) {
- if ($type)
- $entite = ($type == 'syndic') ? 'site' : $type;
- else {
- // Si ca ressemble a une URL d'objet, ce n'est pas la home
- // et on provoque un 404
- if (preg_match(',^[^\.]+(\.html)?$,', $url)) {
- $entite = '404';
- $contexte['erreur'] = ''; // qu'afficher ici ? l'url n'existe pas... on ne sait plus dire de quel type d'objet il s'agit
- }
- }
- }
- define('_SET_HTML_BASE',1);
- return array($contexte, $entite, null, $is_qs?$entite:null);
- }
- ?>