Spațiu (punctuație)

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Semne de punctuatie
apostrof ' '
bar /
două puncte :
liniuță ondulată
liniuță - - - -
paranteze () [] {} ⟨⟩ <>
puncte de suspendare ... ...
punct şi virgulă ;
Semn de exclamare ! ¡
punct fix .
Semnul întrebării ? ¿
punct de mijloc ·
spaţiu  
întindere de unire -
virgulă ,
ghilimele «» '' ""
Semne tipografice
asterisc *
asterism
backslash \
bara verticală | ¦
hashtag #
melc sau comercial @
circumflex ^
drepturi de autor ©
și comercial ( et ) &
frunza de aldină
grad °
indicator ordinal º ª
interrobang
ironie
pastilă
mana mica
numele mărcii ®
Mai puțin -
Notă
număr
obelisc † ‡
obelus ÷
paragraf §
pentru ×
procent / mii / punct de bază %
zbura piciorul
Mai mult +
primul
punct glonț
tilde ~
piatră funerară
sublinia _
cratimă-minus -
la fel =
Simboluri monetare
Ortografie · Semn diacritic

Space ( „“) este, în ortografie , orice spațiu gol utilizat pentru secțiuni separate de text scris. Convențional, cu toate acestea, indică zona goală între cuvânt și cuvânt. Convențiile privind prezența și dimensiunea spațiilor dintre cuvinte variază de la o limbă la alta. Multe „caractere spațiale” diferite sunt disponibile în seturile de calculatoare pentru a reprezenta spații de diferite dimensiuni și semnificații.

Limbi naturale

Italianul modern folosește spațiul pentru a separa cuvintele. Convenții variază în ceea ce privește distanța de oprire completă , exclamație punct, un semn de întrebare și cratimă (vezi mai jos). Nu toate limbile folosesc spații între cuvinte. Spațiile nu au fost folosite în limba latină , până despre 7 - secolele 9 - lea . Vechi ebraica si araba face uz de spații, în parte pentru a compensa pierderea de claritate datorită eliminării vocalelor. În mod tradițional toate CJK limbi nu au spații: moderne chinezești și japoneze ( cu excepția, pentru japoneză, atunci când scrise cu puține sau fără kanji ) nu le folosesc, dar moderne coreene spații utilizări.

Spații și punctuație

În cea mai rafinată tipografie, sunt prevăzute spații de corecție limitate pentru a evita contactul prea strâns între semnele de punctuație și litere. Acest lucru se întâmpla încă în Italia la mijlocul secolului al XIX-lea, iar francezii încă se adaptează la această regulă. Cu toate acestea, în tipografia italiană nu mai este folosită în mod obișnuit (în ciuda necesității pentru aceasta cu unele litere cursive și numere cardinale atunci când sunt urmate imediat de o paranteză de închidere) și, prin urmare, nu se lasă spațiu în niciunul dintre aceste cazuri, cu excepția liniuțe.

Utilizarea IT

În sintaxa limbaje de programare , spații sunt adesea folosite pentru a explicit separate pentru token - uri . În plus față de această utilizare I pentru spațiile de odihnă și alte personaje invizibile ( NEWLINE , fila, etc.) sunt în mod normal , ignorate de limbaje de programare moderne. Excepțiile sunt Haskell , ABC și Python , care utilizează numărul de spații în indentare pentru a indica începutul unui bloc și ezoterice limbaj de programare pe spațiul liber , în care spațiile sunt singurul punct de vedere sintactic semnificativ element.

Editoare de text , procesoare de texte , desktop publishing software diferă în modul în care acestea afișează spațiu pe ecran și modul în care acestea afișează spații la sfârșitul liniilor în funcție de dimensiunea ecranului sau coloane. În unele cazuri , spațiile sunt pur și simplu reprezentate de un spațiu gol, în altele un punct de mijloc poate fi utilizat sau alte simboluri. Multe caractere diferite (descrise mai jos) ar putea fi folosite pentru a produce spații și funcțiile „non-caractere” (cum ar fi marginile și setările filelor) pot afecta, de asemenea, spațiul.

Fonturi spațiale și tipografie digitală

În calculator de codare a caracterelor, spațiul ro pentru uz general este Unicode caracterul U + 0,020 (32 în zecimal). Odată afișat, este adesea considerat nesemnificativ atunci când apare la sfârșitul unui rând de text sau când face parte dintr-o secvență de caractere invizibile, deci poate fi omis sau „prăbușit” în astfel de circumstanțe.

În corectura, numai spațiile em și EN sunt reprezentate cu acest caracter (în limba engleză sunt numite un em-quad sau un en-quad), în timp ce alte tipuri de spații sunt reprezentate cu un semn numeric (#).

Non spațiul -breaking , U + 00A0 (160 decimal), apare ca spațiu normal , dar este non-pliabil. Este , de asemenea , utilizat pentru a preveni trecerea automată la linie și text indentat, cu toate că unele World Wide Web Autoritățile descurajează utilizarea sa în aceste scopuri.

O em cratimă poate fi , de asemenea , urmat de un spațiu de păr, U + 200A (8202 zecimală). Acest tip de spațiu este mai îngust decât un spațiu normal și este rar folosit singur. Acesta poate fi scris în HTML folosind entitate . Din păcate , foarte puțini agenți de utilizator sunt capabili de a afișa spațiul de păr corect: în multe cazuri , rezultatul este un simbol sau semn de întrebare diferite pe ecran, în funcție de fontul utilizat și capacitățile de afișare.

Spațiu normal în comparație cu spațiul pentru păr
Spațiu normal stanga dreapta stanga dreapta
Spațiu normal cu o liniuță stanga dreapta stanga dreapta
Spațiu pentru păr cu o liniuță stânga - dreapta stanga dreapta
Fără spații și cratimă în em stanga dreapta stanga dreapta

Unicode definește multe alte caractere spațiu cu caracteristici semantice și de afișare specifice așa cum se arată în tabelul de mai jos. În funcție de browser și de fontul utilizat pentru a afișa tabelul, este posibil ca unele spații să nu fie redate corect:

Caracterele spațiale definite în Unicode
Cod Fără un lider Valoare HTML Nume În bloc Vizualizare Descriere
U + 0020 Spaţiu Latină de bază ] [ Spațiu normal, egal cu caracterul ASCII 0x20
U + 00A0 &nbsp; Spațiu fără pauze Supliment latin-1 ] [ Identic cu U + 0020, dar nu în punctul în care linia urmează să fie ruptă
U + 1680 Marker spațial Ogham Ogham ] [ Folosit pentru separarea interword în Ogam texte. În mod normal, o linie verticală în text vertical sau o linie orizontală în text orizontal, dar poate fi un gol în fonturi fără stem. Necesită un font Ogham.
U + 2002 &ensp;
&#x02002;
&#8194;
Space En,
o Nut
Punctuaţie ] [ Largo onu RO ( o jumătate de em )
U + 2003 &emsp;
&#x02003;
&#8195;
Space Em,
sau Carne de oaie
Punctuaţie ] [ Largo un em
U + 2004 &#x02004;
&#8196;
Spațiu Trei-pe-Em,
sau spațiu gros
Punctuaţie ] [ O treime din spațiul em
U + 2005 &#x02005;
&#8197;
Spațiu patru pe em,
sau spațiu mediu
Punctuaţie ] [ Un sfert din lățime em
U + 2006 &#x02006;
&#8198;
Spațiu Six-Per-Em Punctuaţie ] [ O șesime din lățime em. În tipărirea electronică, este uneori echivalat cu U + 2009.
U + 2007 &#x02007;
&#8199;
Figura Spațiu Punctuaţie ] [ În fonturile monospațiate este egal cu lățimea unei cifre
U + 2008 &#x02008;
&#8200;
Punctuația spațiului Punctuaţie ] [ Este la fel de largă ca punctuația îngustă în font
U + 2009 &thinsp;
&#x02009;
&#8201;
Spațiu subțire Punctuaţie ] [ O cincime (uneori o șesime) din lățimea unui em
U + 200A &#x0200A;
&#8203;
Spațiu pentru păr Punctuaţie ] [ Subțire ca un spațiu subțire
U + 200B &#x0200B;
&#8204;
Spațiu cu lățime zero Punctuaţie ] [ Folosit pentru a indica separarea cuvintelor la sistemele de procesare a textului atunci când se utilizează scripturi care nu utilizează spații vizibile; în mod normal , separarea nu este vizibil, dar poate fi extins în pasajele care sunt justificate . În HTML pagini poate fi folosit pentru a rupe liniile în cuvinte lungi sau ca un înlocuitor pentru <WBR> tag - ul a cărui utilizare a fost depreciat până la apariția HTML5 . În orice caz, nu este acceptat de toate browserele web , în special prin Internet Explorer ). [1]
U + 202F Spațiu strâns fără pauză Punctuaţie ] [ Similar cu spațiul No-Break U + 00A0
U + 205F Spațiu mediu matematic Punctuaţie ] [ Folosit în formule matematice
U + 2060 Word Joiner Punctuaţie ] [ Identic cu U + 200B, dar nu în punctul în care linia urmează să fie spartă. Introdus în Unicode 3.2 pentru a înlocui „spațiul cu lățime zero fără pauză” (caracterul U + FEFF) a cărui utilizare a fost depreciată.
U + 3000 Spațiul ideografic Simbol și punctuație pentru limbile CJK ] [ La fel de lată ca celula a unui caracter CJK
U + FEFF Spațiu cu lățime zero fără pauze
= Byte Order Mark (BOM)
Formulare de prezentare arabă-B ] [ Folosit în principal ca font de Byte Order Mark. Utilizată ca indicație de neîntrerupere, utilizarea este depreciată de Unicode 3.2. Folosiți în schimb U + 2060.

Unicode oferă, de asemenea, câteva caractere vizibile de utilizat atunci când este necesar un „simbol de control” al blocului de text: simbolul spațiului (U + 2420), simbolul gol (U + 2422), și caseta Open (U + 2423).

Spațiu caractere în limbaje de marcare

Space caractere care apar în poziții ilogice în cadrul elementului în cazul în care schimbările încep atât XML și HTML sunt în general ignorate de către procesoarele acestor limbaje de markup. De exemplu, spațiile care apar pe fiecare parte a „ = elementul“ care separă un nume de atribut din valoarea ei nu au nici un efect asupra interpretării documentului. Elementele la sfârșitul tag - uri pot conține „tras“ spații și elemente XML goale pot conține spații înainte de „ /> “.

În valorile atributelor XML, secvențele de spații sunt tratate ca un singur spațiu atunci când documentul este citit de un analizor. [2] Spațiile conținute în elementul XML astfel tratat nu sunt modificate de parser, dar aplicația care primește informații de la Parserul poate alege să aplice reguli similare cu conținutul elementului. Autorul unui document XML poate utiliza xml:space="preserve" atribut sau un element pentru a forța parserul pentru a descuraja cererea în aval să își modifice spațiile conținute în elementul.

În cele mai multe elemente de HTML , o secvență de caractere spațiu este tratat ca un „inter-cuvânt separator“, care se poate manifesta ca un singur caracter alb , atunci când textul este redat într - un limbaj care inserează în mod normal , un astfel de spațiu între cuvinte. [3] Rendering este necesar să se aplice un tratament mai literal spațiu gol la anumite elemente, cum ar fi pre și orice element pentru care CSS este folosit pentru a aplica un pre - tratament asemănător spațiu. În astfel de elemente, caracterele albe nu se vor „prăbuși” în separatoarele de cuvinte cheie.

În ambele XML și HTML, spațiu non-rupere nu este tratată ca un spațiu și , prin urmare , nu este supus regulilor de mai sus.

Tipuri de spațiu

Cele mai utilizate distanțe includ:

  • Un spațiu (spațiere franceză): este utilizat în țările vorbitoare de limbă latină de tip ISO și este tipic, printre altele, pentru browserele web (în special pe internet);
  • Spațiu dublu (spațierea în limba engleză): utilizat la mașinile de scris monospațiate (mașini de scris);
  • Spațiu mărit (aproximativ un spațiu și o treime): este utilizat mai ales în sistemele Linotype și Tex;
  • Nici un spațiu: acesta este utilizat în Hashtaguri ;

Notă

Elemente conexe

Alte proiecte

linkuri externe