فایل HTM چیست؟
فایل هایی با پسوند .htm نشان دهنده زبان نشانه گذاری فرامتن برای ایجاد صفحات وب برای نمایش در مرورگرهای وب مانند گوگل کروم، اینترنت اکسپلورر، فایرفاکس و تعدادی دیگر هستند. این نشانه گذاری برای ایجاد صفحات ثابت برای انتشار در وب جهانی (WWW) برای دسترسی دیگران تعریف می کند. این نشانه گذاری ها به مرورگرها می گویند که چگونه محتویات یک صفحه وب را نمایش دهند. چنین صفحاتی میتوانند حاوی متن ساده، تصاویر، پیوندهایی به صفحات دیگر، ویدیوها و سایر اطلاعات رسانهای باشند. هنگامی که یک صفحه وب منتشر می شود، می توانید با مشاهده منبع صفحه، به کد نشانه گذاری پشت آن نگاهی بیندازید. مرورگرهای مدرن اجازه میدهند تا هر بخش از یک صفحه وب را که در آن هر زیربخش یا عنصر نشانهگذاری در منبع HTM توضیح داده شده است، بررسی شود.
تاریخچه مختصر HTM
Since its inception and first role out, the HTML specifications have been maintained by World Wide Web Consortium (W3C) since 1996. در سال 2000 نیز به یک استاندارد بین المللی تبدیل شد (ISO/IEC 15445:2000). در سال 1999، HTML 4.01 منتشر شد. در سال 2004، گروه کاری فناوری کاربردی ابرمتن وب (WHATWG) شروع به کار بر روی نسخه HTML5 کرد که در سال 2008 به صورت مشترک با W3C تبدیل شد. در 28 اکتبر 2014 تکمیل و استاندارد شد.
فرمت فایل HTML
یک سند HTML 4 از سه بخش تشکیل شده است:
- یک خط حاوی اطلاعات نسخه HTML
- یک بخش هدر اعلامی
- بدنه ای که حاوی محتوای واقعی سند است. بدنه ممکن است توسط عنصر BODY یا عنصر FRAMESET اجرا شود تا بدنه را در فریم ها قرار دهد
هر بخش را می توان با فاصله های سفید، خطوط جدید، برگه ها و نظرات دنبال کرد. نمونه ای از یک سند HTML ساده به شرح زیر است:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
<HTML>
<HEAD>
<TITLE>Understanding HTML File Format</TITLE>
</HEAD>
<BODY>
<P>Hello World!
</BODY>
</HTML>
اطلاعات نسخه
خط اول کد، ، یک اعلان doctype نامیده می شود و به مرورگر می گوید که صفحه در کدام نسخه از HTML نوشته شده است. بسته به نسخه HTML، تعدادی اعلانات مختلف doctype وجود دارد که تعریف نوع سند (DTD) را در حال استفاده برای سند نامگذاری می کند. هر DTD با عناصر دیگری که پشتیبانی می کند متفاوت است و به شرح زیر متفاوت است:
HTML 4.01 Strict - شامل تمام عناصر و ویژگیهایی است که [منسوخ] نشدهاند (https://www.w3.org/TR/html401/conform.html#deprecated) یا در اسناد فریمست ظاهر نمیشوند.
HTML 4.01 Transitional - شامل همه چیز در DTD سختگیرانه به علاوه عناصر و ویژگی های منسوخ شده (که بیشتر آنها به ارائه بصری مربوط می شوند)
HTML 4.01 Framesset - همه چیز را در فریم های انتقالی DTD بعلاوه نیز شامل می شود
برای HTML5، اطلاعات نسخه به سادگی همانطور که در زیر ذکر شده است.
<!DOCTYPE html>
اطلاعات سرصفحه
سربرگ یک سند HTML می تواند شامل تعدادی از عناصر HTML باشد که توسط مرورگر ارائه نشده اند. چنین عناصری یا ابرداده ای هستند که اطلاعات مربوط به صفحه را توصیف می کنند یا شامل بخش هایی هستند که برای واکشی اطلاعات از منابع خارجی مانند شیوه نامه های CSS یا فایل های جاوا اسکریپت استفاده می شوند. سرصفحه یک صفحه با \ نشان داده می شود تگ کنید و با \ ختم شود برچسب زدن
برای تنظیم عنوان صفحه، <title> عنصر تنها عنصری است که در تگ های <head> مورد نیاز است. موتورهای جستجو نیز برای شناسایی عنوان یک صفحه از آن استفاده می کنند.
اطلاعات بدن
این بخش اصلی در فایل است که شامل تمام محتویات فایل است که توسط مرورگرها ارائه می شود. بدنه Html میتواند حاوی نشانههایی باشد که میتوانند به بلوکهای ساختمانی مختلف به شکل برچسبها اشاره کنند. این می تواند حاوی انواع مختلفی از اطلاعات مانند متن، تصویر، رنگ، گرافیک و غیره باشد. علاوه بر این، عناصر صوتی و تصویری نیز می توانند در بدنه html برای رندر توسط مرورگرها تعبیه شوند. با وجود برنامه سبک شیت های مدرن برای نمایش بصری، ویژگی های ارائه BODY مانند رنگ پس زمینه، رنگ پیوند، رنگ متن و غیره منسوخ شده است. بنابراین، اثرات مشابه را می توان با استفاده از شیوه نامه های زیر به دست آورد:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
<HTML>
<HEAD>
<TITLE>Inline Style Sheets referencing</TITLE>
<STYLE type#"text/css">
BODY { background: white; color: black}
A:link { color: red }
A:visited { color: maroon }
A:active { color: fuchsia }
</STYLE>
</HEAD>
<BODY>
... document body...
</BODY>
</HTML>
استایل شیت های درون خطی به راحتی جاسازی می شوند و برای کاربردهای سریع در جلوه های بصری، استایل شیت های خارجی امکان استقرار یک بار و دسترسی در بسیاری از مکان ها را راحت تر می کند.
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
<HTML>
<HEAD>
<TITLE>Linking to External style sheets</TITLE>
<LINK rel#"stylesheet" type#"text/css" href#"smartstyle.css">
</HEAD>
<BODY>
... document body...
</BODY>
</HTML>
عناصر HTML
همانطور که قبلا ذکر شد، محتویات داخل HTML Body با برچسب هایی که به عنوان عناصر Html نیز شناخته می شوند، نمایش داده می شوند. هر تگ می تواند اطلاعات اضافی در قالب ویژگی هایی داشته باشد که به صورت نوشته می شوند
<tag attribute1#"value1" attribute2#"value2">
اگرچه لازم نیست که با هر تگ ویژگی داشته باشید. اگر ویژگی ها ذکر نشده باشد، در هر مورد از مقادیر پیش فرض استفاده می شود. در زیر چند نمونه از عناصر ذکر شده است:
سرتیتر
<head>
<title>The Title</title>
</head>
سرفصل ها
<h1>Heading level 1</h1>
<h2>Heading level 2</h2>
<h3>Heading level 3</h3>
<h4>Heading level 4</h4>
<h5>Heading level 5</h5>
<h6>Heading level 6</h6>
پاراگراف ها
<p>Paragraph 1</p> <p>Paragraph 2</p>