فایل HTML چیست؟
HTML (Hyper Text Markup Language) پسوندی برای صفحات وب است که برای نمایش در مرورگرها ایجاد شده است. HTML که به عنوان زبان وب شناخته می شود، با الزامات اطلاعاتی جدید برای نمایش بخشی از صفحات وب تکامل یافته است. آخرین نوع به نام HTML 5 شناخته می شود که انعطاف پذیری زیادی را برای کار با زبان می دهد. صفحات HTML یا از سرور دریافت می شوند، جایی که میزبانی می شوند، یا می توانند از سیستم محلی بارگیری شوند. هر صفحه HTML از عناصر HTML مانند فرم ها، متن، تصاویر، انیمیشن ها، لینک ها و غیره تشکیل شده است. همچنین می تواند برنامه هایی را که به زبان های برنامه نویسی نوشته شده اند مانند جاوا اسکریپت و برگه های سبک (CSS) برای نمایش طرح کلی جاسازی کند.
تاریخچه مختصر
Since its inception and first role out, the HTML specifications have been maintained by World Wide Web Consortium (W3C) since 1996. در سال 2000 نیز به یک استاندارد بین المللی تبدیل شد (ISO/IEC 15445:2000). در سال 1999، HTML 4.01 منتشر شد. در سال 2004، گروه کاری فناوری کاربردی ابرمتن وب (WHATWG) شروع به کار بر روی نسخه HTML5 کرد که در سال 2008 به صورت مشترک با W3C تبدیل شد. در 28 اکتبر 2014 تکمیل و استاندارد شد.
ساختار فرمت فایل HTML
یک سند HTML 4 از سه بخش تشکیل شده است:
- یک خط حاوی اطلاعات نسخه HTML
- یک بخش هدر اعلامی
- بدنه ای که حاوی محتوای واقعی سند است. بدنه ممکن است توسط عنصر BODY یا عنصر FRAMESET اجرا شود تا بدنه را در فریم ها قرار دهد
هر بخش را می توان با فاصله های سفید، خطوط جدید، برگه ها و نظرات دنبال کرد. نمونه ای از یک سند HTML ساده به شرح زیر است:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
<HTML>
<HEAD>
<TITLE>Understanding فرمت فایل HTML</TITLE>
</HEAD>
<BODY>
<P>Hello World!
</BODY>
</HTML>
اطلاعات نسخه
خط اول کد، <!DOCTYPE html> ، یک اعلان doctype نامیده می شود و به مرورگر می گوید که صفحه در کدام نسخه از HTML نوشته شده است. بسته به نسخه HTML، تعدادی اعلانات مختلف doctype وجود دارد که تعریف نوع سند (DTD) را برای سند مورد استفاده قرار می دهد. هر DTD در عناصری که پشتیبانی می کند با سایرین متفاوت است و به شرح زیر متفاوت است:
HTML 4.01 Strict - شامل تمام عناصر و ویژگی هایی است که [منسوخ] نشده اند (https://www.w3.org/TR/html401/conform.html#deprecated) یا در اسناد frameset ظاهر نمی شوند
HTML 4.01 Transitional - شامل همه چیز در DTD سختگیرانه به علاوه عناصر و ویژگی های منسوخ شده (که بیشتر آنها به ارائه بصری مربوط می شوند)
HTML 4.01 Framesset - همه چیز را در فریم های انتقالی DTD بعلاوه نیز شامل می شود
برای HTML5، اطلاعات نسخه به سادگی همانطور که در زیر ذکر شده است.
<!DOCTYPE html>
اطلاعات هدر HTML
سربرگ یک سند HTML می تواند شامل تعدادی از عناصر HTML باشد که توسط مرورگر ارائه نشده اند. چنین عناصری یا ابرداده ای هستند که اطلاعات مربوط به صفحه را توصیف می کنند یا شامل بخش هایی هستند که برای واکشی اطلاعات از منابع خارجی مانند شیوه نامه های CSS یا فایل های جاوا اسکریپت استفاده می شوند. هدر یک صفحه با تگ head نشان داده می شود.
برای تنظیم عنوان صفحه، عنصر title تنها عنصری است که در داخل مورد نیاز است برچسب ها موتورهای جستجو نیز برای شناسایی عنوان یک صفحه از آن استفاده می کنند.
اطلاعات بدنه HTML
این بخش اصلی در فایل است که شامل تمام محتویات فایل است که توسط مرورگرها ارائه می شود. بدنه Html میتواند حاوی نشانههایی باشد که میتوانند به بلوکهای ساختمانی مختلف به شکل برچسبها اشاره کنند. این می تواند حاوی انواع مختلفی از اطلاعات مانند متن، تصویر، رنگ، گرافیک و غیره باشد. علاوه بر این، عناصر صوتی و تصویری نیز می توانند در بدنه html برای رندر توسط مرورگرها تعبیه شوند. با وجود نرم افزار شیت های سبک مدرن برای نمایش بصری، ویژگی های ارائه BODY مانند رنگ پس زمینه، رنگ پیوند، رنگ متن و غیره منسوخ شده است. بنابراین، اثرات مشابه را می توان با استفاده از شیوه نامه های زیر به دست آورد:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
<HTML>
<HEAD>
<TITLE>Inline Style Sheets referencing</TITLE>
<STYLE type#"text/css">
BODY { background: white; color: black}
A:link { color: red }
A:visited { color: maroon }
A:active { color: fuchsia }
</STYLE>
</HEAD>
<BODY>
... document body...
</BODY>
</HTML>
استایل شیت های درون خطی به راحتی جاسازی می شوند و برای کاربردهای سریع در جلوه های بصری، استایل شیت های خارجی امکان استقرار یک بار و دسترسی در بسیاری از مکان ها را راحت تر می کند.
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
<HTML>
<HEAD>
<TITLE>Linking to External style sheets</TITLE>
<LINK rel#"stylesheet" type#"text/css" href#"smartstyle.css">
</HEAD>
<BODY>
... document body...
</BODY>
</HTML>
عناصر HTML
همانطور که قبلا ذکر شد، محتویات داخل HTML Body با برچسب هایی که به عنوان عناصر Html نیز شناخته می شوند، نمایش داده می شوند. هر تگ می تواند اطلاعات اضافی در قالب ویژگی هایی داشته باشد که به صورت نوشته می شوند<tag attribute1#value1 attribute2#value2> ، اگرچه لازم نیست با هر تگ دارای ویژگی باشد. اگر ویژگی ها ذکر نشده باشد، در هر مورد از مقادیر پیش فرض استفاده می شود. در زیر چند نمونه از عناصر ذکر شده است:
سرتیتر
<head>
<title>The Title</title>
</head>
سرفصل ها
<h1>Heading level 1</h1>
<h2>Heading level 2</h2>
<h3>Heading level 3</h3>
<h4>Heading level 4</h4>
<h5>Heading level 5</h5>
<h6>Heading level 6</h6>
پاراگراف ها
<p>Paragraph 1</p> <p>Paragraph 2</p>