Spațiu (punctuație)
Space ( „“) este, în ortografie , orice spațiu gol utilizat pentru secțiuni separate de text scris. Convențional, cu toate acestea, indică zona goală între cuvânt și cuvânt. Convențiile privind prezența și dimensiunea spațiilor dintre cuvinte variază de la o limbă la alta. Multe „caractere spațiale” diferite sunt disponibile în seturile de calculatoare pentru a reprezenta spații de diferite dimensiuni și semnificații.
Limbi naturale
Italianul modern folosește spațiul pentru a separa cuvintele. Convenții variază în ceea ce privește distanța de oprire completă , exclamație punct, un semn de întrebare și cratimă (vezi mai jos). Nu toate limbile folosesc spații între cuvinte. Spațiile nu au fost folosite în limba latină , până despre 7 - secolele 9 - lea . Vechi ebraica si araba face uz de spații, în parte pentru a compensa pierderea de claritate datorită eliminării vocalelor. În mod tradițional toate CJK limbi nu au spații: moderne chinezești și japoneze ( cu excepția, pentru japoneză, atunci când scrise cu puține sau fără kanji ) nu le folosesc, dar moderne coreene spații utilizări.
Spații și punctuație
În cea mai rafinată tipografie, sunt prevăzute spații de corecție limitate pentru a evita contactul prea strâns între semnele de punctuație și litere. Acest lucru se întâmpla încă în Italia la mijlocul secolului al XIX-lea, iar francezii încă se adaptează la această regulă. Cu toate acestea, în tipografia italiană nu mai este folosită în mod obișnuit (în ciuda necesității pentru aceasta cu unele litere cursive și numere cardinale atunci când sunt urmate imediat de o paranteză de închidere) și, prin urmare, nu se lasă spațiu în niciunul dintre aceste cazuri, cu excepția liniuțe.
Utilizarea IT
În sintaxa limbaje de programare , spații sunt adesea folosite pentru a explicit separate pentru token - uri . În plus față de această utilizare I pentru spațiile de odihnă și alte personaje invizibile ( NEWLINE , fila, etc.) sunt în mod normal , ignorate de limbaje de programare moderne. Excepțiile sunt Haskell , ABC și Python , care utilizează numărul de spații în indentare pentru a indica începutul unui bloc și ezoterice limbaj de programare pe spațiul liber , în care spațiile sunt singurul punct de vedere sintactic semnificativ element.
Editoare de text , procesoare de texte , desktop publishing software diferă în modul în care acestea afișează spațiu pe ecran și modul în care acestea afișează spații la sfârșitul liniilor în funcție de dimensiunea ecranului sau coloane. În unele cazuri , spațiile sunt pur și simplu reprezentate de un spațiu gol, în altele un punct de mijloc poate fi utilizat sau alte simboluri. Multe caractere diferite (descrise mai jos) ar putea fi folosite pentru a produce spații și funcțiile „non-caractere” (cum ar fi marginile și setările filelor) pot afecta, de asemenea, spațiul.
Fonturi spațiale și tipografie digitală
În calculator de codare a caracterelor, spațiul ro pentru uz general este Unicode caracterul U + 0,020 (32 în zecimal). Odată afișat, este adesea considerat nesemnificativ atunci când apare la sfârșitul unui rând de text sau când face parte dintr-o secvență de caractere invizibile, deci poate fi omis sau „prăbușit” în astfel de circumstanțe.
În corectura, numai spațiile em și EN sunt reprezentate cu acest caracter (în limba engleză sunt numite un em-quad sau un en-quad), în timp ce alte tipuri de spații sunt reprezentate cu un semn numeric (#).
Non spațiul -breaking , U + 00A0 (160 decimal), apare ca spațiu normal , dar este non-pliabil. Este , de asemenea , utilizat pentru a preveni trecerea automată la linie și text indentat, cu toate că unele World Wide Web Autoritățile descurajează utilizarea sa în aceste scopuri.
O em cratimă poate fi , de asemenea , urmat de un spațiu de păr, U + 200A (8202 zecimală). Acest tip de spațiu este mai îngust decât un spațiu normal și este rar folosit singur. Acesta poate fi scris în HTML folosind entitate . Din păcate , foarte puțini agenți de utilizator sunt capabili de a afișa spațiul de păr corect: în multe cazuri , rezultatul este un simbol sau semn de întrebare diferite pe ecran, în funcție de fontul utilizat și capacitățile de afișare.
Spațiu normal | stanga dreapta | stanga dreapta |
---|---|---|
Spațiu normal cu o liniuță | stanga dreapta | stanga dreapta |
Spațiu pentru păr cu o liniuță | stânga - dreapta | stanga dreapta |
Fără spații și cratimă în em | stanga dreapta | stanga dreapta |
Unicode definește multe alte caractere spațiu cu caracteristici semantice și de afișare specifice așa cum se arată în tabelul de mai jos. În funcție de browser și de fontul utilizat pentru a afișa tabelul, este posibil ca unele spații să nu fie redate corect:
Cod | Fără un lider | Valoare HTML | Nume | În bloc | Vizualizare | Descriere |
---|---|---|---|---|---|---|
U + 0020 | Spaţiu | Latină de bază | ] [ | Spațiu normal, egal cu caracterul ASCII 0x20 | ||
U + 00A0 | ✓ | | Spațiu fără pauze | Supliment latin-1 | ] [ | Identic cu U + 0020, dar nu în punctul în care linia urmează să fie ruptă |
U + 1680 | Marker spațial Ogham | Ogham | ] [ | Folosit pentru separarea interword în Ogam texte. În mod normal, o linie verticală în text vertical sau o linie orizontală în text orizontal, dar poate fi un gol în fonturi fără stem. Necesită un font Ogham. | ||
U + 2002 |       | Space En, o Nut | Punctuaţie | ] [ | Largo onu RO ( o jumătate de em ) | |
U + 2003 |       | Space Em, sau Carne de oaie | Punctuaţie | ] [ | Largo un em | |
U + 2004 |     | Spațiu Trei-pe-Em, sau spațiu gros | Punctuaţie | ] [ | O treime din spațiul em | |
U + 2005 |     | Spațiu patru pe em, sau spațiu mediu | Punctuaţie | ] [ | Un sfert din lățime em | |
U + 2006 |     | Spațiu Six-Per-Em | Punctuaţie | ] [ | O șesime din lățime em. În tipărirea electronică, este uneori echivalat cu U + 2009. | |
U + 2007 | ✓ |     | Figura Spațiu | Punctuaţie | ] [ | În fonturile monospațiate este egal cu lățimea unei cifre |
U + 2008 |     | Punctuația spațiului | Punctuaţie | ] [ | Este la fel de largă ca punctuația îngustă în font | |
U + 2009 |       | Spațiu subțire | Punctuaţie | ] [ | O cincime (uneori o șesime) din lățimea unui em | |
U + 200A |   ​ | Spațiu pentru păr | Punctuaţie | ] [ | Subțire ca un spațiu subțire | |
U + 200B | ​ ‌ | Spațiu cu lățime zero | Punctuaţie | ] [ | Folosit pentru a indica separarea cuvintelor la sistemele de procesare a textului atunci când se utilizează scripturi care nu utilizează spații vizibile; în mod normal , separarea nu este vizibil, dar poate fi extins în pasajele care sunt justificate . În HTML pagini poate fi folosit pentru a rupe liniile în cuvinte lungi sau ca un înlocuitor pentru <WBR> tag - ul a cărui utilizare a fost depreciat până la apariția HTML5 . În orice caz, nu este acceptat de toate browserele web , în special prin Internet Explorer ). [1] | |
U + 202F | ✓ | Spațiu strâns fără pauză | Punctuaţie | ] [ | Similar cu spațiul No-Break U + 00A0 | |
U + 205F | Spațiu mediu matematic | Punctuaţie | ] [ | Folosit în formule matematice | ||
U + 2060 | ✓ | Word Joiner | Punctuaţie | ] [ | Identic cu U + 200B, dar nu în punctul în care linia urmează să fie spartă. Introdus în Unicode 3.2 pentru a înlocui „spațiul cu lățime zero fără pauză” (caracterul U + FEFF) a cărui utilizare a fost depreciată. | |
U + 3000 | Spațiul ideografic | Simbol și punctuație pentru limbile CJK | ] [ | La fel de lată ca celula a unui caracter CJK | ||
U + FEFF | ✓ | Spațiu cu lățime zero fără pauze = Byte Order Mark (BOM) | Formulare de prezentare arabă-B | ] [ | Folosit în principal ca font de Byte Order Mark. Utilizată ca indicație de neîntrerupere, utilizarea este depreciată de Unicode 3.2. Folosiți în schimb U + 2060. |
Unicode oferă, de asemenea, câteva caractere vizibile de utilizat atunci când este necesar un „simbol de control” al blocului de text: simbolul spațiului ␠ (U + 2420), simbolul gol ␢ (U + 2422), și caseta Open ␣ (U + 2423).
Spațiu caractere în limbaje de marcare
Space caractere care apar în poziții ilogice în cadrul elementului în cazul în care schimbările încep atât XML și HTML sunt în general ignorate de către procesoarele acestor limbaje de markup. De exemplu, spațiile care apar pe fiecare parte a „ =
elementul“ care separă un nume de atribut din valoarea ei nu au nici un efect asupra interpretării documentului. Elementele la sfârșitul tag - uri pot conține „tras“ spații și elemente XML goale pot conține spații înainte de „ />
“.
În valorile atributelor XML, secvențele de spații sunt tratate ca un singur spațiu atunci când documentul este citit de un analizor. [2] Spațiile conținute în elementul XML astfel tratat nu sunt modificate de parser, dar aplicația care primește informații de la Parserul poate alege să aplice reguli similare cu conținutul elementului. Autorul unui document XML poate utiliza xml:space="preserve"
atribut sau un element pentru a forța parserul pentru a descuraja cererea în aval să își modifice spațiile conținute în elementul.
În cele mai multe elemente de HTML , o secvență de caractere spațiu este tratat ca un „inter-cuvânt separator“, care se poate manifesta ca un singur caracter alb , atunci când textul este redat într - un limbaj care inserează în mod normal , un astfel de spațiu între cuvinte. [3] Rendering este necesar să se aplice un tratament mai literal spațiu gol la anumite elemente, cum ar fi pre
și orice element pentru care CSS este folosit pentru a aplica un pre
- tratament asemănător spațiu. În astfel de elemente, caracterele albe nu se vor „prăbuși” în separatoarele de cuvinte cheie.
În ambele XML și HTML, spațiu non-rupere nu este tratată ca un spațiu și , prin urmare , nu este supus regulilor de mai sus.
Tipuri de spațiu
Cele mai utilizate distanțe includ:
- Un spațiu (spațiere franceză): este utilizat în țările vorbitoare de limbă latină de tip ISO și este tipic, printre altele, pentru browserele web (în special pe internet);
- Spațiu dublu (spațierea în limba engleză): utilizat la mașinile de scris monospațiate (mașini de scris);
- Spațiu mărit (aproximativ un spațiu și o treime): este utilizat mai ales în sistemele Linotype și Tex;
- Nici un spațiu: acesta este utilizat în Hashtaguri ;
Notă
- ^ (EN) HTML <WBR> tag - ul , w3schools.com.
- ^ Atribut Valoare-Normalizare
- ^ Spațiu alb
Elemente conexe
Alte proiecte
- Wikimedia Commons conține imagini sau alte fișiere de pe spațiu
linkuri externe
- (RO) spații Unicode , Jukka "Yucca" Korpela.
- (RO) caractere adesea confundat , pe cs.sfu.ca.