PDF

از ویکیپدیا، دانشنامه آزاد
پرش به ناوبری پرش به جستجو
فرمت سند قابل حمل
Adobe-PDF-Icon
نماد Adobe PDF
Adobe PDF.svg
پسوند نام فایل.pdf
نوع رسانه اینترنتی
  • application/pdf، [1]
  • application/x-pdf
  • application/x-bzpdf
  • application/x-gzpdf
کد را تایپ کنیدPDF [1] (شامل یک فضای واحد)
شناسه نوع یکنواخت (UTI)com.adobe.pdf
عدد جادویی%PDF
توسعه یافته توسطAdobe Inc. (1991–2008)
ISO (2008–)
انتشار اولیه15 خرداد 93 ; 28 سال پیش (1993-06-15)
آخرین نسخه
2.0
توسعه یافته بهPDF/A ، PDF/E ، PDF/UA ، PDF/VT ، PDF/X
استانداردISO 32000-2
فرمت باز ؟آره
سایت اینترنتیwww .iso .org /standard /75839 .html

فرمت سند قابل حمل ( PDF )، استاندارد شده به عنوان ISO 32000 ، یک فرمت فایل است که توسط Adobe در سال 1992 برای ارائه اسناد ، از جمله قالب بندی متن و تصاویر، به شیوه ای مستقل از نرم افزار کاربردی ، سخت افزار و سیستم عامل ها توسعه یافته است . [2] [3] بر اساس زبان پست اسکریپت ، هر فایل PDF شرح کاملی از یک سند مسطح با طرح‌بندی ثابت، شامل متن، فونت ، گرافیک برداری ، تصاویر شطرنجی را در بر می‌گیرد.و سایر اطلاعات مورد نیاز برای نمایش آن PDF ریشه در "کملوت پروژه" توسط یکی از بنیانگذاران نرم افزار Adobe آغاز جان وارناک در سال 1991. [4]

PDF به عنوان ISO 32000 در سال 2008 استاندارد شد. [5] آخرین ویرایش به عنوان ISO 32000-2:2020 در دسامبر 2020 منتشر شد.

فایل‌های پی‌دی‌اف ممکن است علاوه بر متن و گرافیک مسطح حاوی محتوای متنوعی از جمله عناصر ساختاری منطقی، عناصر تعاملی مانند حاشیه‌نویسی و فیلدهای فرم، لایه‌ها، رسانه‌های غنی (از جمله محتوای ویدیویی)، اشیاء سه‌بعدی با استفاده از U3D یا PRC و موارد دیگر باشد. فرمت های داده . مشخصات PDF همچنین رمزگذاری و امضای دیجیتال ، پیوست فایل و ابرداده را برای فعال کردن گردش‌های کاری که به این ویژگی‌ها نیاز دارند، ارائه می‌کند.

تاریخچه

Adobe Systems مشخصات PDF را به صورت رایگان در سال 1993 در دسترس قرار داد. در سال های اولیه PDF عمدتاً در گردش کار انتشار دسکتاپ محبوب بود و با فرمت های مختلفی مانند DjVu ، Envoy ، Common Ground Digital Paper ، Farallon Replica و حتی خود Adobe رقابت می کرد. فرمت پست اسکریپت

PDF یک فرمت اختصاصی بود که توسط Adobe کنترل می شد تا اینکه در 1 ژوئیه 2008 به عنوان یک استاندارد باز منتشر شد و توسط سازمان بین المللی استاندارد به عنوان ISO 32000-1:2008 منتشر شد، [6] [7] که در آن زمان کنترل مشخصات به کمیته ایزو متشکل از کارشناسان صنعت داوطلب منتقل شد. در سال 2008، ادوبی مجوز ثبت اختراع عمومی ISO 32000-1 را منتشر کرد که حقوقی بدون حق امتیاز برای تمام پتنت های متعلق به Adobe که برای ساخت، استفاده، فروش و توزیع پیاده سازی های منطبق با PDF ضروری هستند، اعطا کرد . [8]

PDF 1.7، نسخه ششم مشخصات PDF که به ISO 32000-1 تبدیل شد، شامل برخی از فناوری های اختصاصی است که فقط توسط Adobe تعریف شده اند، مانند Adobe XML Forms Architecture (XFA) و پسوند جاوا اسکریپت برای Acrobat، که توسط ISO 32000-1 به عنوان ارجاع داده شده است. هنجاری و ضروری برای اجرای کامل مشخصات ISO 32000-1. [9] این فناوری‌های اختصاصی استاندارد نیستند و مشخصات آنها فقط در وب‌سایت Adobe منتشر شده است. [10] [11] [12] [13] بسیاری از آنها نیز توسط پیاده سازی های شخص ثالث محبوب PDF پشتیبانی نمی شوند.

در دسامبر 2020، ویرایش دوم PDF 2.0، ISO 32000-2:2020، شامل توضیحات، اصلاحات و به روز رسانی های مهم به مراجع هنجاری منتشر شد. [14] ISO 32000-2 هیچ فناوری اختصاصی را به عنوان مرجع هنجاری در بر نمی گیرد. [15]

جزئیات فنی

یک فایل PDF اغلب ترکیبی از گرافیک برداری ، متن و گرافیک بیت مپ است . انواع اصلی محتوا در PDF عبارتند از:

  • متن ذخیره شده به عنوان جریان محتوا (یعنی در متن ساده کدگذاری نشده است ).
  • گرافیک برداری برای تصاویر و طرح هایی که از اشکال و خطوط تشکیل شده است.
  • گرافیک شطرنجی برای عکس ها و انواع دیگر تصاویر
  • اشیاء چند رسانه ای در سند

در ویرایش‌های بعدی PDF، یک سند PDF همچنین می‌تواند از پیوندها (داخل سند یا صفحه وب)، فرم‌ها، جاوا اسکریپت (در ابتدا به عنوان یک افزونه برای Acrobat 3.0 در دسترس بود) یا هر نوع محتوای تعبیه‌شده دیگری که می‌توان با استفاده از افزونه‌ها مدیریت کرد، پشتیبانی کرد.

PDF سه فناوری را ترکیب می کند:

  • زیرمجموعه ای از زبان برنامه نویسی توضیحات صفحه PostScript ، برای تولید طرح و گرافیک.
  • یک سیستم جاسازی / جایگزینی فونت که به فونت‌ها اجازه می‌دهد با اسناد سفر کنند.
  • یک سیستم ذخیره سازی ساختاریافته برای بسته بندی این عناصر و هر محتوای مرتبط در یک فایل واحد، با فشرده سازی داده ها در صورت لزوم.

زبان پست اسکریپت

PostScript یک زبان توصیف صفحه است که در یک مفسر اجرا می شود تا یک تصویر تولید کند، فرآیندی که به منابع زیادی نیاز دارد. این می تواند گرافیک و ویژگی های استاندارد زبان های برنامه نویسی مانند دستورات ifو loopدستورات را کنترل کند. PDF عمدتاً مبتنی بر PostScript است، اما برای حذف ویژگی‌های کنترل جریان مانند اینها ساده شده است، در حالی که دستورات گرافیکی مانند linetoباقی می‌مانند.

اغلب، کد پی دی اف پست اسکریپت از یک فایل پست اسکریپت منبع تولید می شود. دستورات گرافیکی که توسط کد پست اسکریپت خروجی می شوند جمع آوری و توکنیزه می شوند . [ توضیحات لازم ] هر فایل، گرافیک، یا فونتی که سند به آن اشاره دارد نیز جمع آوری می شود. سپس همه چیز در یک فایل فشرده می شود. بنابراین، کل دنیای پست اسکریپت (فونت ها، طرح بندی، اندازه گیری ها) دست نخورده باقی می ماند. [ نیازمند منبع ]

به عنوان یک فرمت سند، PDF چندین مزیت نسبت به PostScript دارد:

  • PDF حاوی نتایج توکن شده و تفسیر شده کد منبع پست اسکریپت است، برای مطابقت مستقیم بین تغییرات در موارد در توضیحات صفحه PDF و تغییرات در ظاهر صفحه حاصل.
  • PDF (از نسخه 1.4) از گرافیک شفاف پشتیبانی می کند . پست اسکریپت ندارد.
  • PostScript یک زبان برنامه نویسی تفسیر شده با حالت جهانی ضمنی است، بنابراین دستورالعمل های همراه با توضیحات یک صفحه می توانند ظاهر هر صفحه بعدی را تحت تاثیر قرار دهند. بنابراین، تمام صفحات قبلی در یک سند PostScript باید پردازش شوند تا ظاهر صحیح یک صفحه مشخص شود، در حالی که هر صفحه در یک سند PDF تحت تأثیر سایرین قرار نمی گیرد. در نتیجه، نمایشگرهای PDF به کاربر این امکان را می دهند که به سرعت به صفحات پایانی یک سند طولانی بپرد، در حالی که یک بیننده پست اسکریپت باید قبل از اینکه بتواند صفحه مقصد را نمایش دهد، تمام صفحات را به صورت متوالی پردازش کند (مگر اینکه قراردادهای ساختاردهی اسناد PostScript اختیاری به دقت رعایت شده باشد. گردآوری و گنجانده شده است).

PDF 1.6 از اسناد سه بعدی تعاملی جاسازی شده در یک فایل PDF پشتیبانی می کند: نقشه های سه بعدی را می توان با استفاده از U3D یا PRC و فرمت های مختلف داده دیگر جاسازی کرد . [16] [17] [18]

فرمت فایل

یک فایل PDF شامل کاراکترهای ASCII 7 بیتی است، به جز عناصر خاصی که ممکن است محتوای باینری داشته باشند. فایل با یک هدر شامل یک عدد جادویی (به عنوان یک رشته قابل خواندن) و نسخه قالب شروع می شود، به عنوان مثال %PDF-1.7. این قالب زیرمجموعه ای از فرمت COS (ساختار شیء «چرخ فلک») است. [19] یک فایل درختی COS عمدتاً از اشیا تشکیل شده است که 9 نوع از آنها وجود دارد: [15]

  • مقادیر بولی که نشان دهنده درست یا نادرست است
  • اعداد واقعی
  • اعداد صحیح
  • رشته ها ، داخل پرانتز ( (...)). رشته ها ممکن است دارای کاراکترهای 8 بیتی باشند.
  • نام‌ها که با یک اسلاید رو به جلو شروع می‌شوند ( /)
  • آرایه ها , مجموعه های مرتب شده از اشیاء محصور شده در داخل پرانتز ( [...])
  • واژه‌نامه‌ها ، مجموعه‌ای از اشیاء نمایه‌شده با نام‌های محصور شده در پرانتزهای زاویه‌ای دوتایی ( <<...>>)
  • جریان ، معمولا حاوی مقادیر زیادی از داده های باینری اختیاری فشرده، قبل از یک فرهنگ لغت و محصور بین streamو endstreamکلمات کلیدی.
  • پوچ شی

علاوه بر این، ممکن است نظراتی وجود داشته باشد که با علامت درصد ( %) معرفی شوند. نظرات ممکن است دارای کاراکترهای 8 بیتی باشند.

اشیا ممکن است مستقیم (در یک شی دیگر تعبیه شده) یا غیر مستقیم باشند . اشیاء غیر مستقیم با یک شماره تعداد شی و یک تعداد نسل و بین تعریف objو endobjکلمات کلیدی اگر ساکن در ریشه سند. با شروع نسخه PDF 1.5، اشیاء غیرمستقیم (به جز سایر جریان‌ها) ممکن است در جریان‌های خاصی به نام جریان‌های شی (با علامت‌گذاری شده /Type /ObjStm) قرار بگیرند . این تکنیک اشیاء غیر جریانی را قادر می‌سازد تا فیلترهای جریانی استانداردی روی آن‌ها اعمال کنند، اندازه فایل‌هایی را که دارای تعداد زیادی اشیاء غیرمستقیم کوچک هستند کاهش می‌دهد و مخصوصاً برای برچسب‌گذاری‌شده PDF مفید است . جریان های شی از تعیین یک شی پشتیبانی نمی کنندتعداد نسل (غیر از 0).

یک جدول شاخص که جدول مرجع متقاطع نیز نامیده می‌شود، در نزدیکی انتهای فایل قرار دارد و مقدار افست بایت هر شی غیرمستقیم را از ابتدای فایل نشان می‌دهد. [20] این طراحی امکان دسترسی تصادفی کارآمد به اشیاء موجود در فایل را فراهم می کند، و همچنین اجازه می دهد تا تغییرات کوچک بدون بازنویسی کل فایل ( به روز رسانی افزایشی ) ایجاد شود. قبل از نسخه PDF 1.5، جدول همیشه در فرمت ASCII خاص است، با xrefکلمه کلیدی مشخص می شود و بدنه اصلی متشکل از اشیاء غیر مستقیم را دنبال می کند. نسخه 1.5 جریان های مرجع اختیاری را معرفی کرد، که شکل یک شی جریان استاندارد را دارند، احتمالاً با فیلترهای اعمال شده. چنین جریانی ممکن است به جای جدول ارجاع متقابل ASCII استفاده شود و شامل افست ها و سایر اطلاعات در قالب باینری است. فرمت از این جهت انعطاف‌پذیر است که امکان تعیین عرض اعداد صحیح (با استفاده از /Wآرایه) را فراهم می‌کند، به‌طور مثال، سندی با اندازه بیش از 64  کیلوبایت ممکن است تنها 2 بایت را برای جابجایی شی‌ها اختصاص دهد.

در انتهای یک فایل پی دی اف پاورقی شامل موارد زیر است:

  • startxrefکلمه کلیدی به دنبال آن یک افست از شروع جدول ارجاع متقابل (شروع با xrefکلمه کلیدی) یا شی جریان ارجاع متقابل، و پس از
  • %%EOF پایان فایل نشانگر.

اگر از یک جریان مرجع متقابل استفاده نمی شود، قبل از پاورقی trailerکلمه کلیدی قرار می گیرد و پس از آن یک فرهنگ لغت حاوی اطلاعاتی قرار می گیرد که در غیر این صورت در فرهنگ لغت شی جریان مرجع متقابل وجود دارد:

  • اشاره ای به شی ریشه ساختار درختی که به عنوان کاتالوگ نیز شناخته می شود ( /Root)
  • تعداد اشیاء غیر مستقیم در جدول ارجاع متقابل ( /Size)
  • سایر اطلاعات اختیاری

دو طرح برای فایل های PDF وجود دارد: غیر خطی (بهینه نشده) و خطی ("بهینه"). فایل‌های PDF غیرخطی می‌توانند کوچک‌تر از همتایان خطی خود باشند، اگرچه دسترسی به آن‌ها کندتر است زیرا بخش‌هایی از داده‌های مورد نیاز برای جمع‌آوری صفحات سند در سراسر فایل PDF پراکنده است. فایل‌های پی‌دی‌اف خطی (همچنین فایل‌های پی‌دی‌اف «بهینه‌سازی‌شده» یا «بهینه‌سازی‌شده وب» نیز نامیده می‌شوند) به‌گونه‌ای ساخته می‌شوند که آنها را قادر می‌سازد در یک افزونه مرورگر وب بدون منتظر ماندن برای دانلود کل فایل خوانده شوند، زیرا همه اشیاء مورد نیاز برای صفحه اول هستند. برای نمایش در ابتدای فایل به طور بهینه سازماندهی می شوند. [21] فایل های PDF ممکن است با استفاده از نرم افزار Adobe Acrobat یا QPDF بهینه شوند .

مدل تصویربرداری

طراحی اولیه نحوه نمایش گرافیک در PDF بسیار شبیه به PostScript است ، به جز استفاده از شفافیت ، که در PDF 1.4 اضافه شده است.

گرافیک PDF از یک سیستم مختصات دکارتی مستقل از دستگاه برای توصیف سطح صفحه استفاده می کند. توضیحات صفحه PDF می‌تواند از یک ماتریس برای مقیاس‌بندی ، چرخش یا انحراف عناصر گرافیکی استفاده کند. یک مفهوم کلیدی در PDF حالت گرافیکی است ، که مجموعه ای از پارامترهای گرافیکی است که ممکن است با توضیحات صفحه تغییر، ذخیره و بازیابی شوند . PDF (در نسخه 2.0) دارای 25 ویژگی حالت گرافیکی است که برخی از مهمترین آنها عبارتند از:

گرافیک برداری

مانند پست اسکریپت ، گرافیک های برداری در PDF با مسیرها ساخته می شوند . مسیرها معمولاً از خطوط و منحنی‌های مکعبی بزیه تشکیل شده‌اند ، اما می‌توانند از خطوط کلی متن نیز ساخته شوند. برخلاف PostScript، PDF به یک مسیر اجازه نمی دهد خطوط کلی متن را با خطوط و منحنی ها ترکیب کند. مسیرها را می توان نوازش کرد، پر کرد، پر کرد و سپس نوازش کرد، یا برای برش استفاده کرد . ضربه‌ها و پرها می‌توانند از هر مجموعه رنگی در حالت گرافیکی استفاده کنند، از جمله الگوها . PDF از انواع مختلفی از الگوها پشتیبانی می کند. ساده ترین الگوی کاشی کاری است که در آن یک اثر هنری مشخص شده است که به طور مکرر کشیده شود. این ممکن است یک الگوی کاشی کاری رنگی باشد، با رنگ های مشخص شده در شی الگو، یا یک الگوی کاشی کاری بدون رنگ ، که مشخصات رنگ را به زمان ترسیم الگو موکول می کند. با شروع PDF 1.3 یک الگوی سایه نیز وجود دارد که به طور مداوم رنگ های متفاوت را ترسیم می کند. هفت نوع الگوی سایه‌زنی وجود دارد که ساده‌ترین آنها سایه‌زنی محوری (نوع 2) و سایه‌زنی شعاعی (نوع 3) است.

تصاویر شطرنجی

تصاویر شطرنجی در PDF (به نام Image XObjects ) توسط فرهنگ لغت با یک جریان مرتبط نشان داده می شوند. فرهنگ لغت ویژگی های تصویر را توصیف می کند و جریان حاوی داده های تصویر است. (به ندرت، تصاویر شطرنجی کوچک ممکن است مستقیماً به عنوان یک تصویر درون خطی در توضیحات صفحه جاسازی شوند .) تصاویر معمولاً برای اهداف فشرده سازی فیلتر می شوند. فیلترهای تصویری پشتیبانی شده در PDF شامل فیلترهای همه منظوره زیر هستند:

  • ASCII85Decode ، فیلتری که برای قرار دادن جریان در ASCII 7 بیتی استفاده می شود .
  • ASCIIHexDecode ، شبیه به ASCII85Decode اما کمتر فشرده،
  • FlateDecode ، یک فیلتر معمول مورد استفاده بر اساس جلوگیری از تورم الگوریتم تعریف شده در RFC  1951 (جلوگیری از تورم نیز در استفاده از gzip ، PNG ، و فایل های فشرده از فرمت های فایل در میان دیگران)؛ معرفی شده در PDF 1.2; می‌تواند از یکی از دو گروه عملکرد پیش‌بینی‌کننده برای فشرده‌سازی فشرده‌تر zlib/deflate استفاده کند: پیش‌بینی‌کننده 2 از مشخصات TIFF 6.0 و پیش‌بینی‌کننده‌ها (فیلترها) از مشخصات PNG ( RFC 2083 ). 
  • LZWDecode ، یک فیلتر مبتنی بر فشرده سازی LZW . می‌تواند از یکی از دو گروه عملکرد پیش‌بینی‌کننده برای فشرده‌سازی فشرده‌تر LZW استفاده کند: پیش‌بینی‌کننده 2 از مشخصات TIFF 6.0 و پیش‌بینی‌کننده‌ها (فیلترها) از مشخصات PNG،
  • RunLengthDecode ، یک روش فشرده سازی ساده برای جریان های با داده های تکراری با استفاده از الگوریتم رمزگذاری طول اجرا و فیلترهای خاص تصویر،
  • DCTDecode ، یک فیلتر با اتلاف بر اساس استاندارد JPEG ،
  • CCITTFaxDecode ، یک فشرده سازی lossless در سطح بی (سیاه و سفید / سفید) فیلتر بر اساس گروه 3 یا گروه 4 CCITT (ITU-T) فکس استاندارد فشرده سازی تعریف شده در ITU-T T.4 و T.6،
  • JBIG2Decode ، یک فیلتر دو سطحی (سیاه/سفید) با اتلاف یا بدون تلفات بر اساس استاندارد JBIG2 ، معرفی شده در PDF 1.4، و
  • JPXDecode ، یک فیلتر با اتلاف یا بدون تلفات بر اساس استاندارد JPEG 2000 ، معرفی شده در PDF 1.5.

به طور معمول تمام محتوای تصویر در یک PDF در فایل تعبیه شده است. اما PDF اجازه می دهد تا داده های تصویر در فایل های خارجی با استفاده از جریان های خارجی یا تصاویر جایگزین ذخیره شوند . زیر مجموعه های استاندارد PDF، از جمله PDF/A و PDF/X ، این ویژگی ها را ممنوع می کنند.

متن

متن در PDF با عناصر متنی در جریان محتوای صفحه نمایش داده می شود. یک عنصر متنی مشخص می کند که کاراکترها باید در موقعیت های خاصی رسم شوند. کاراکترها با استفاده از رمزگذاری یک منبع فونت انتخاب شده مشخص می شوند .

یک شی فونت در PDF توصیفی از حروف دیجیتال است . ممکن است یا ویژگی های یک تایپ فیس را توصیف کند، یا ممکن است شامل یک فایل فونت جاسازی شده باشد . مورد دوم به نام فونت های جاسازی شده در حالی که سابق است به نام فونت unembedded . فایل‌های فونتی که ممکن است جاسازی شوند بر اساس فرمت‌های فونت دیجیتال استاندارد پرکاربرد هستند: نوع 1 (و نوع فشرده آن CFF)، TrueType و (شروع با PDF 1.6) OpenType . علاوه بر این، PDF از نوع نوع 3 پشتیبانی می کند که در آن اجزای فونت توسط اپراتورهای گرافیکی PDF توصیف می شوند.

چهارده تایپ فیس، معروف به 14 فونت استاندارد ، اهمیت ویژه ای در اسناد PDF دارند:

  • Times (v3) (به صورت منظم، ایتالیک، پررنگ و مورب پررنگ)
  • پیک (به صورت منظم، مایل، پررنگ و مایل پررنگ)
  • Helvetica (v3) (به صورت منظم، مایل، پررنگ و مایل پررنگ)
  • سمبل
  • Zapf Dingbats

گاهی اوقات به این فونت ها فونت های پایه چهارده می گویند . [22] این فونت‌ها یا فونت‌های جایگزین مناسب با معیارهای مشابه، باید در اکثر پی‌دی‌اف‌خوان‌ها در دسترس باشند، اما تضمینی برای در دسترس بودن آن‌ها در خواننده وجود ندارد و تنها در صورتی که سیستم آنها را نصب کرده باشد، ممکن است به درستی نمایش داده شوند. [23] اگر فونت ها در PDF جاسازی نشده باشند، ممکن است جایگزین شوند.

در رشته‌های متنی، کاراکترها با استفاده از کدهای کاراکتر (اعداد صحیح) نشان داده می‌شوند که با استفاده از یک رمزگذاری به حروف عباراتی در فونت فعلی نگاشت می‌شوند . تعدادی رمزگذاری از پیش تعریف شده، از جمله WinAnsi ، MacRoman ، و بسیاری از رمزگذاری‌ها برای زبان‌های آسیای شرقی وجود دارد و یک فونت می‌تواند رمزگذاری داخلی خود را داشته باشد. (اگرچه رمزگذاری‌های WinAnsi و MacRoman از ویژگی‌های تاریخی سیستم‌عامل‌های ویندوز و مکینتاش مشتق شده‌اند ، فونت‌هایی که از این رمزگذاری‌ها استفاده می‌کنند در هر پلتفرمی به‌خوبی کار می‌کنند.) PDF می‌تواند یک رمزگذاری از پیش تعریف‌شده برای استفاده، کدگذاری داخلی فونت را مشخص کند یا ارائه کند. یک جدول جستجو از تفاوت ها در یک رمزگذاری از پیش تعریف شده یا داخلی (با فونت های TrueType توصیه نمی شود).[24] مکانیسم‌های رمزگذاری در PDF برای فونت‌های نوع 1 طراحی شده‌اند و قوانین اعمال آن‌ها در فونت‌های TrueType پیچیده است.

برای فونت های بزرگ یا فونت هایی با حروف غیر استاندارد، از رمزگذاری های ویژه Identity-H (برای نوشتن افقی) و Identity-V (برای عمودی) استفاده می شود. با چنین فونت هایی، اگر قرار است اطلاعات معنایی در مورد کاراکترها حفظ شود ، لازم است یک جدول ToUnicode ارائه شود.

شفافیت

مدل تصویربرداری اولیه PDF، مانند پست اسکریپت، مات بود : هر شیء ترسیم شده در صفحه به طور کامل جایگزین هر چیزی که قبلاً در همان مکان علامت گذاری شده بود، شد. در پی‌دی‌اف 1.4، مدل تصویربرداری به منظور شفاف‌سازی گسترش یافت. هنگامی که از شفافیت استفاده می شود، اشیاء جدید با اشیاء علامت گذاری شده قبلی برای ایجاد جلوه های ترکیبی تعامل دارند. افزودن شفافیت به PDF با استفاده از پسوندهای جدید طراحی شده است که در محصولات نوشته شده با PDF 1.3 و مشخصات قبلی نادیده گرفته می شود. در نتیجه، فایل‌هایی که از شفافیت کمی استفاده می‌کنند ممکن است توسط بینندگان مسن‌تر به‌طور قابل قبولی مشاهده شوند، اما فایل‌هایی که به‌طور گسترده از شفافیت استفاده می‌کنند، می‌توانند توسط بیننده قدیمی‌تر بدون هشدار به اشتباه مشاهده شوند.

پسوندهای شفافیت بر اساس مفاهیم کلیدی گروه های شفافیت ، حالت های ترکیبی ، شکل و آلفا هستند . این مدل کاملاً با ویژگی‌های Adobe Illustrator نسخه 9 هماهنگ است. حالت‌های ترکیبی بر اساس مواردی بود که در آن زمان توسط Adobe Photoshop استفاده می‌شد . هنگامی که مشخصات PDF 1.4 منتشر شد، فرمول های محاسبه حالت های ترکیبی توسط Adobe مخفی نگه داشته شد. از آن زمان منتشر شده اند. [25]

مفهوم گروه شفافیت در مشخصات PDF مستقل از مفاهیم موجود "گروه" یا "لایه" در برنامه هایی مانند Adobe Illustrator است. این گروه‌بندی‌ها روابط منطقی بین اشیا را منعکس می‌کنند که هنگام ویرایش آن اشیا معنادار هستند، اما بخشی از مدل تصویربرداری نیستند.

ویژگی های اضافی

ساختار منطقی و قابلیت دسترسی

یک PDF "برچسب" (به بند 14.8 در ISO 32000 مراجعه کنید) شامل ساختار سند و اطلاعات معنایی است تا امکان استخراج متن قابل اعتماد و دسترسی را فراهم کند . از نظر فنی، پی‌دی‌اف برچسب‌گذاری‌شده استفاده سبک‌شده از قالبی است که بر اساس چارچوب ساختار منطقی معرفی‌شده در PDF 1.3 است. پی دی اف برچسب گذاری شده مجموعه ای از انواع ساختار استاندارد و ویژگی ها را تعریف می کند که به محتوای صفحه (متن، گرافیک و تصاویر) امکان استخراج و استفاده مجدد برای مقاصد دیگر را می دهد. [26]

در شرایطی که یک فایل PDF فقط برای چاپ در نظر گرفته شده است، نیازی به برچسب PDF نیست. از آنجایی که این ویژگی اختیاری است، و از آنجایی که قوانین PDF برچسب‌گذاری شده در ISO 32000-1 نسبتا مبهم بود، پشتیبانی از PDF برچسب‌گذاری شده در میان دستگاه‌های مصرف‌کننده، از جمله فناوری کمکی (AT)، در حال حاضر ناهموار است. [27] ISO 32000-2، با این حال، شامل یک بحث بهبودیافته درباره PDF برچسب گذاری شده است که پیش بینی می شود پذیرش بیشتر را تسهیل کند.

یک زیرمجموعه استاندارد ISO از PDF که به طور خاص در دسترس‌پذیری را هدف قرار داده است، PDF/UA ، برای اولین بار در سال 2012 منتشر شد.

گروه‌های محتوای اختیاری (لایه‌ها)

با معرفی نسخه PDF، 1.5 (2003) مفهوم لایه ها به وجود آمد. لایه‌ها، یا به‌طور رسمی‌تر به عنوان گروه‌های محتوای اختیاری (OCG) شناخته می‌شوند، به بخش‌هایی از محتوا در یک سند PDF اشاره می‌کنند که می‌توانند به‌طور انتخابی توسط نویسندگان یا مصرف‌کنندگان سند مشاهده یا پنهان شوند. این قابلیت در نقشه های CAD، آثار هنری لایه ای، نقشه ها، اسناد چند زبانه و غیره مفید است.

اساساً شامل یک دیکشنری خصوصیات محتوای اختیاری است که به ریشه سند اضافه شده است. این فرهنگ لغت شامل آرایه‌ای از گروه‌های محتوای اختیاری (OCGs) است که هر کدام مجموعه‌ای از اطلاعات را توصیف می‌کنند و هر کدام ممکن است به‌صورت جداگانه نمایش داده یا حذف شوند، به‌علاوه مجموعه‌ای از دیکشنری‌های پیکربندی محتوای اختیاری، که وضعیت (نمایش‌شده یا سرکوب‌شده) را نشان می‌دهد. OCG داده شده است.

رمزگذاری و امضا

یک فایل PDF ممکن است برای امنیت رمزگذاری شود ، در این صورت برای مشاهده یا ویرایش محتویات به رمز عبور نیاز است. PDF 2.0 رمزگذاری AES 256 بیتی را به عنوان استاندارد برای فایل های PDF 2.0 تعریف می کند. مرجع PDF همچنین راه هایی را تعریف می کند که اشخاص ثالث می توانند سیستم های رمزگذاری خود را برای PDF تعریف کنند.

فایل‌های PDF ممکن است به صورت دیجیتال امضا شده باشند تا احراز هویت ایمن را فراهم کنند. جزئیات کامل پیاده سازی امضای دیجیتال در PDF در ISO 32000-2 ارائه شده است.

فایل‌های PDF ممکن است حاوی محدودیت‌های DRM تعبیه‌شده باشند که کنترل‌های بیشتری را فراهم می‌کند که کپی، ویرایش یا چاپ را محدود می‌کند. این محدودیت ها به نرم افزار خواننده بستگی دارد که از آنها پیروی کند، بنابراین امنیت آنها محدود است.

امنیت استاندارد ارائه شده توسط Acrobat PDF از دو روش مختلف و دو رمز عبور مختلف تشکیل شده است: یک رمز عبور کاربر که فایل را رمزگذاری می کند و از باز شدن آن جلوگیری می کند، و یک رمز عبور مالک ، که عملیاتی را مشخص می کند که حتی در صورت رمزگشایی سند باید محدود شود. شامل اصلاح، چاپ، یا کپی متن و گرافیک خارج از سند، یا افزودن یا اصلاح یادداشت های متنی و فیلدهای AcroForm . رمز عبور کاربر فایل را رمزگذاری می کند، در حالی که رمز عبور مالک نه، در عوض برای رعایت این محدودیت ها به نرم افزار مشتری تکیه می کند. رمز عبور مالک را می توان به راحتی توسط نرم افزار از جمله برخی از خدمات آنلاین رایگان حذف کرد. [28]بنابراین، محدودیت‌های استفاده‌ای که نویسنده سند روی یک سند PDF قرار می‌دهد، ایمن نیستند و پس از توزیع فایل نمی‌توان از آن اطمینان حاصل کرد. این هشدار هنگام اعمال چنین محدودیت هایی با استفاده از نرم افزار Adobe Acrobat برای ایجاد یا ویرایش فایل های PDF نمایش داده می شود.

حتی بدون حذف رمز عبور، اکثر نرم‌افزارهای رایگان یا متن‌باز PDF خوان‌ها «محافظت‌های» مجوز را نادیده می‌گیرند و به کاربر اجازه می‌دهند تا گزیده‌هایی از متن را چاپ یا کپی کند، گویی سند با محافظت از رمز عبور محدود نشده است. [29] [30] [31]

با شروع PDF 1.5، امضاهای حقوق استفاده (UR) برای فعال کردن ویژگی های تعاملی اضافی استفاده می شود که به طور پیش فرض در یک برنامه نمایشگر PDF خاص در دسترس نیستند. این امضا برای تأیید اینکه مجوزها توسط یک مقام اعطا کننده با حسن نیت اعطا شده است استفاده می شود. به عنوان مثال، می توان از آن برای اجازه دادن به یک کاربر استفاده کرد: [32]

  • برای ذخیره سند PDF به همراه یک فرم تغییر یافته و/یا داده های حاشیه نویسی
  • فایل های داده فرم را در قالب های FDF، XFDF و متن (CSV/TSV) وارد کنید
  • فایل های داده فرم را در فرمت های FDF و XFDF صادر کنید
  • داده های فرم را ارسال کنید
  • نمونه صفحات جدید را از قالب صفحه ای به نام
  • یک امضای دیجیتال را در فیلد فرم امضای دیجیتال موجود اعمال کنید
  • ایجاد، حذف، تغییر، کپی، وارد کردن و صادرات حاشیه نویسی

برای مثال، Adobe Systems با استفاده از رمزنگاری کلید عمومی ، مجوزهایی را برای فعال کردن ویژگی‌های اضافی در Adobe Reader اعطا می‌کند . Adobe Reader تأیید می کند که امضا از گواهی یک مرجع گواهی مجاز Adobe استفاده می کند. هر برنامه PDF می تواند از همین مکانیسم برای اهداف خود استفاده کند. [32]

تحت شرایط خاص از جمله سیستم‌های وصله نشده گیرنده، اطلاعاتی که گیرنده یک سند امضا شده دیجیتال می‌بیند، می‌تواند توسط فرستنده پس از امضای سند توسط امضاکننده دستکاری شود. [33]

PAdES ( PDF Advanced Electronic Signatures ) مجموعه ای از محدودیت ها و پسوندهای PDF و ISO 32000-1 [34] است که آن را برای امضاهای الکترونیکی پیشرفته مناسب می کند . این توسط ETSI با عنوان TS 102 778 منتشر شده است. [35]

پیوست های فایل

فایل‌های PDF می‌توانند فایل‌های پیوستی داشته باشند که پردازنده‌ها ممکن است به آن‌ها دسترسی داشته باشند و آن‌ها را باز کنند یا در یک فایل سیستم محلی ذخیره کنند. [36]

فراداده

فایل های PDF می توانند شامل دو نوع متادیتا باشند. [37] اولین دیکشنری اطلاعات اسناد است، مجموعه‌ای از فیلدهای کلیدی/مقدار مانند نویسنده، عنوان، موضوع، تاریخ ایجاد و به‌روزرسانی. این اختیاری است و از Infoکلید در تریلر فایل ارجاع داده می شود. مجموعه کوچکی از فیلدها تعریف شده است و در صورت لزوم می توان آن را با مقادیر متنی اضافی گسترش داد. این روش در PDF 2.0 منسوخ شده است.

در PDF 1.4، پشتیبانی برای جریان‌های فراداده اضافه شد، با استفاده از بستر فراداده توسعه‌پذیر (XMP) برای افزودن متادیتای توسعه‌پذیر مبتنی بر استانداردهای XML همانطور که در فرمت‌های فایل دیگر استفاده می‌شود. PDF 2.0 اجازه می دهد تا ابرداده ها به هر شیء در سند، مانند اطلاعات مربوط به تصاویر جاسازی شده، فونت ها، تصاویر و همچنین کل سند (ضمیمه کردن کاتالوگ سند)، با استفاده از یک طرحواره قابل توسعه، پیوست شوند.

اسناد PDF همچنین می‌توانند حاوی تنظیمات نمایش باشند، از جمله طرح‌بندی نمایش صفحه و سطح زوم در یک شی Viewer Preferences. Adobe Reader از این تنظیمات برای لغو تنظیمات پیش فرض کاربر هنگام باز کردن سند استفاده می کند. [38] Adobe Reader رایگان نمی تواند این تنظیمات را حذف کند.

قابلیت دسترسی

فایل های PDF را می توان به طور خاص ایجاد کرد تا برای افراد دارای معلولیت در دسترس باشد. [39] [40] [41] [42] [43] فرمت‌های فایل PDF که از سال 2014 استفاده می‌شوند می‌توانند شامل برچسب‌ها، معادل‌های متنی، زیرنویس‌ها، توضیحات صوتی و موارد دیگر باشند. برخی از نرم افزارها می توانند به طور خودکار فایل های پی دی اف برچسب گذاری شده را تولید کنند ، اما این ویژگی همیشه به طور پیش فرض فعال نیست. [44] [45] صفحه‌خوان‌های پیشرو ، از جمله JAWS ، Window-Eyes ، Hal و Kurzweil 1000 و 3000 می‌توانند PDF برچسب‌گذاری شده را بخوانند. [46] [47]علاوه بر این، پی‌دی‌اف‌های برچسب‌گذاری شده را می‌توان برای خوانندگانی که دارای اختلالات بینایی هستند، دوباره جریان داد و بزرگ‌نمایی کرد. افزودن برچسب ها به PDF های قدیمی و آنهایی که از اسناد اسکن شده تولید می شوند می تواند چالش هایی را ایجاد کند.

یکی از چالش‌های مهم دسترسی به PDF این است که اسناد PDF دارای سه نمای مجزا هستند که بسته به نوع ایجاد سند، ممکن است با یکدیگر ناسازگار باشند. سه نما عبارتند از (i) نمای فیزیکی، (ب) نمای برچسب ها و (iii) نمای محتوا. نمای فیزیکی نمایش داده می شود و چاپ می شود (چیزی که اکثر مردم آن را یک سند PDF در نظر می گیرند). نمای برچسب ها همان چیزی است که صفحه خوان ها و سایر فناوری های کمکی برای ارائه تجربه ناوبری و خواندن با کیفیت بالا به کاربران دارای معلولیت استفاده می کنند. نمای محتوا بر اساس ترتیب فیزیکی اشیاء در جریان محتوای PDF است و ممکن است توسط نرم افزاری نمایش داده شود که نمای تگ ها را به طور کامل پشتیبانی نمی کند، مانند ویژگی Reflow در Adobe's Reader.

PDF/UA ، استاندارد بین المللی برای PDF قابل دسترس بر اساس ISO 32000-1 برای اولین بار به عنوان ISO 14289-1 در سال 2012 منتشر شد و زبان هنجاری را برای فناوری PDF قابل دسترس ایجاد می کند.

چند رسانه ای

Rich Media PDF یک فایل PDF شامل محتوای تعاملی است که می تواند درون فایل جاسازی یا پیوند داده شود.

فرم ها

فرم های تعاملی مکانیزمی برای افزودن فرم ها به فرمت فایل PDF است. PDF در حال حاضر از دو روش مختلف برای یکپارچه سازی داده ها و فرم های PDF پشتیبانی می کند. امروزه هر دو قالب در مشخصات PDF همزیستی دارند: [32] [48] [49] [50]

  • AcroForms (همچنین به عنوان فرم های Acrobat شناخته می شود)، در مشخصات فرمت PDF 1.2 معرفی شد و در تمام مشخصات PDF بعدی گنجانده شد.
  • فرم های XML Forms Architecture (XFA) که در مشخصات فرمت PDF 1.5 معرفی شده اند. Adobe XFA Forms با AcroForms سازگار نیست. [51] XFA از PDF با PDF 2.0 منسوخ شد.

AcroForms در قالب PDF 1.2 معرفی شد. AcroForms اجازه استفاده از اشیاء ( مانند جعبه متن ، دکمه های رادیویی ، و غیره ) و برخی از کد ( مثلا جاوا اسکریپت ). در کنار انواع عملکرد استاندارد PDF، فرم‌های تعاملی (AcroForms) از ارسال، تنظیم مجدد و وارد کردن داده‌ها پشتیبانی می‌کنند. عمل "submit" نام و مقادیر فیلدهای فرم تعاملی انتخاب شده را به یک منبع یاب یکنواخت مشخص (URL) منتقل می کند. نام‌ها و مقادیر فیلدهای فرم تعاملی ممکن است در هر یک از قالب‌های زیر ارسال شوند (بسته به تنظیمات پرچم‌های ExportFormat، SubmitPDF و XFDF): [32]

فرمت فرم HTML
مشخصات HTML 4.01 از PDF 1.5. HTML 2.0 از 1.2
فرمت داده فرم ها (FDF)
بر اساس PDF، از همان نحو استفاده می کند و اساساً ساختار فایل مشابهی دارد، اما بسیار ساده تر از PDF است، زیرا بدنه یک سند FDF تنها از یک شی مورد نیاز تشکیل شده است. فرمت داده فرم ها در مشخصات PDF (از PDF 1.2) تعریف شده است. فرمت داده فرم ها را می توان هنگام ارسال داده های فرم به سرور، دریافت پاسخ و ترکیب آن در فرم تعاملی استفاده کرد. همچنین می‌توان از آن برای صادرات داده‌های فرم به فایل‌های مستقل استفاده کرد که می‌توانند به فرم تعاملی PDF مربوطه وارد شوند. FDF در ابتدا در سال 1996 به عنوان بخشی از ISO 32000-2:2017 تعریف شد. [ نیازمند منبع ]
فرمت داده فرم های XML (XFDF)
(مشخصات فرمت داده فرمت XML خارجی، نسخه 2.0؛ پشتیبانی از PDF 1.5؛ جایگزین فرمت ارسال فرم "XML" تعریف شده در PDF 1.4) نسخه XML فرمت داده فرمت، اما XFDF تنها زیر مجموعه ای از FDF حاوی فرم ها و حاشیه نویسی برخی از مدخل‌های فرهنگ لغت FDF معادل XFDF ندارند - مانند وضعیت، کدگذاری، جاوا اسکریپت، کلیدهای صفحه، EmbeddedFDF، تفاوت‌ها و هدف. علاوه بر این، XFDF اجازه ایجاد یا اضافه کردن صفحات جدید بر اساس داده های داده شده را نمی دهد. همانطور که می توان در هنگام استفاده از یک فایل FDF انجام داد. مشخصات XFDF در مشخصات PDF 1.5 (و در نسخه های بعدی) ارجاع شده است (اما گنجانده نشده است). در XML Forms Data Format Specification به طور جداگانه توضیح داده شده است . [52]مشخصات PDF 1.4 امکان ارسال فرم ها را در قالب XML می داد، اما این با فرمت های XFDF در مشخصات PDF 1.5 جایگزین شد. XFDF با استاندارد XML مطابقت دارد. XFDF را می توان به همان روشی که FDF استفاده کرد. به عنوان مثال، داده‌های فرم به یک سرور ارسال می‌شوند، تغییراتی انجام می‌شود، سپس برگردانده می‌شود و داده‌های فرم جدید در یک فرم تعاملی وارد می‌شوند. همچنین می‌توان از آن برای صادرات داده‌های فرم به فایل‌های مستقل استفاده کرد که می‌توانند به فرم تعاملی PDF مربوطه وارد شوند. از آگوست 2019، XFDF 3.0 یک استاندارد ISO/IEC تحت نام رسمی ISO 19444-1:2019 - مدیریت اسناد - فرمت داده فرم‌های XML - قسمت 1: استفاده از ISO 32000-2 (XFDF 3.0) است . [53] این استاندارد مرجع هنجاری ISO 32000-2 است.
PDF
کل سند را می توان به جای فیلدها و مقادیر مجزا ارسال کرد، همانطور که در PDF 1.4 تعریف شده است.

AcroForms می‌تواند مقادیر فیلد فرم را در فایل‌های مستقل خارجی حاوی جفت‌های کلید:مقدار نگه دارد. فایل‌های خارجی ممکن است از فایل‌های Forms Data Format (FDF) و XML Forms Data Format (XFDF) استفاده کنند. [54] [52] [55] امضاهای حقوق استفاده (UR) حقوقی را برای فایل‌های داده‌های فرم وارد کردن در قالب‌های FDF، XFDF و متن ( CSV / TSV ) تعریف می‌کنند و فایل‌های داده فرم را در قالب‌های FDF و XFDF صادر می‌کنند. [32]

در PDF 1.5، Adobe Systems یک فرمت اختصاصی برای فرم ها معرفی کرد. Adobe XML Forms Architecture (XFA). Adobe XFA Forms با ویژگی AcroForms ISO 32000 سازگار نیست و اکثر پردازنده‌های PDF محتوای XFA را مدیریت نمی‌کنند. مشخصات XFA از ISO 32000-1/PDF 1.7 به عنوان یک مشخصات اختصاصی خارجی ارجاع شده است و به طور کامل از PDF با ISO 32000-2 (PDF 2.0) منسوخ شده است.

صدور مجوز

هر کسی ممکن است برنامه هایی ایجاد کند که بتواند فایل های PDF را بدون پرداخت حق امتیاز به سیستم های Adobe بخواند و بنویسد . Adobe برای PDF حق اختراع دارد، اما برای استفاده بدون حق امتیاز در توسعه نرم افزار منطبق با مشخصات PDF آن مجوز می دهد . [56]

امنیت

در نوامبر 2019، محققان دانشگاه روهر بوخوم و Hackmanit GmbH حملاتی را به فایل‌های PDF با امضای دیجیتال منتشر کردند. [57] آنها نشان دادند که چگونه می توان محتوای قابل مشاهده را در یک PDF امضا شده بدون باطل کردن امضا در 21 از 22 بیننده PDF دسکتاپ و 6 از 8 سرویس اعتبارسنجی آنلاین با سوء استفاده از نقص های پیاده سازی تغییر داد. در همان کنفرانس، آنها به علاوه نحوه استخراج متن ساده محتوای رمزگذاری شده در PDF را نشان دادند. [58] در سال 2021، آنها حملات جدید به اصطلاح سایه‌ای را به فایل‌های PDF نشان دادند که از انعطاف‌پذیری ویژگی‌های ارائه‌شده در مشخصات سوءاستفاده می‌کردند. [59] مروری بر مسائل امنیتی در فایل‌های PDF در مورد انکار سرویس ، افشای اطلاعات ،دستکاری داده ها و حملات خودسرانه اجرای کد توسط ینس مولر ارائه شد. [60] [61]

پیوست های PDF حامل ویروس برای اولین بار در سال 2001 کشف شد. این ویروس که OUTLOOK.PDFWorm یا Peachy نام دارد ، از Microsoft Outlook برای ارسال خود به عنوان یک فایل PDF پیوست Adobe استفاده می کند. با Adobe Acrobat فعال شد، اما نه با Acrobat Reader. [62]

هر از گاهی، آسیب پذیری های جدیدی در نسخه های مختلف Adobe Reader کشف می شود، [63]شرکت را وادار به صدور اصلاحات امنیتی کرد. سایر پی دی اف خوان ها نیز مستعد ابتلا هستند. یکی از عوامل تشدید کننده این است که اگر یک صفحه وب دارای یک فایل پی‌دی‌اف جاسازی‌شده باشد، می‌توان پی‌دی‌اف‌خوان را طوری پیکربندی کرد که به‌طور خودکار شروع به کار کند، و یک بردار برای حمله فراهم کند. اگر یک صفحه وب مخرب حاوی یک فایل PDF آلوده باشد که از آسیب‌پذیری در پی‌دی‌اف‌خوان استفاده می‌کند، حتی اگر مرورگر امن باشد، ممکن است سیستم به خطر بیفتد. برخی از این آسیب‌پذیری‌ها نتیجه استاندارد PDF است که اجازه می‌دهد اسناد PDF با جاوا اسکریپت اسکریپت شوند. غیرفعال کردن اجرای جاوا اسکریپت در پی‌دی‌اف‌خوان می‌تواند به کاهش چنین اکسپلویت‌های آینده کمک کند، اگرچه در برابر سوء استفاده‌ها در سایر بخش‌های نرم‌افزار مشاهده PDF محافظت نمی‌کند.کارشناسان امنیتی می گویند که جاوا اسکریپت برای یک پی دی اف خوان ضروری نیست و مزایای امنیتی ناشی از غیرفعال کردن جاوا اسکریپت بیشتر از مشکلات سازگاری ناشی از آن است.[64] یکی از راه‌های جلوگیری از سوء استفاده‌های فایل PDF این است که یک سرویس محلی یا وب، فایل‌ها را قبل از مشاهده به فرمت دیگری تبدیل کند.

در 30 مارس 2010، محقق امنیتی دیدیه استیونز، یک سوء استفاده از Adobe Reader و Foxit Reader را گزارش کرد که در صورت درخواست کاربر، یک فایل اجرایی مخرب را اجرا می کند. [65]

نرم افزار

بینندگان و ویرایشگران

نمایشگرهای PDF عموماً رایگان ارائه می شوند و نسخه های زیادی از منابع مختلف در دسترس هستند.

گزینه‌های نرم‌افزاری زیادی برای ایجاد فایل‌های PDF وجود دارد، از جمله قابلیت‌های چاپ PDF که در macOS ، iOS ، [66] و بیشتر توزیع‌های لینوکس ، LibreOffice ، Microsoft Office 2007 (در صورت به‌روزرسانی به SP2 ) و نسخه‌های جدیدتر، [67] WordPerfectScribus ، درایورهای متعدد چاپ PDF برای مایکروسافت ویندوز ، سیستم حروفچینی pdfTeX ، ابزارهای DocBook PDF، برنامه های کاربردی توسعه یافته در اطراف خود Ghostscript و Adobe Acrobat و همچنین Adobe InDesign ،Adobe FrameMaker ، Adobe Illustrator ، Adobe Photoshop . گوگل را آنلاین مجموعه اداری اسناد گوگل اجازه می دهد تا برای آپلود و صرفه جویی در به PDF. برخی از برنامه های وب ابزارهای ویرایش PDF و حاشیه نویسی رایگان را ارائه می دهند.

بنیاد نرم افزار آزاد یک بار فکر به عنوان یکی از پروژه های اولویت بالا به "در حال توسعه رایگان، با کیفیت بالا و مجموعه ای کاملا کاربردی از کتابخانه ها و برنامه هایی که اجرا در قالب فایل PDF و فن آوری مرتبط با استاندارد ISO 32000." [68] [69] با این حال، در سال 2011، پروژه GNU PDF از لیست "پروژه های با اولویت بالا" به دلیل بلوغ کتابخانه Popler حذف شد ، [70] که از استفاده گسترده تری در برنامه هایی مانند Evince با محیط دسکتاپ گنوم پوپلر بر اساس Xpdf [71] [72] است.پایه کد همچنین کتابخانه های توسعه تجاری موجود است که در لیست نرم افزار PDF فهرست شده است .

آپاچی PDFBox پروژه از بنیاد نرم افزار آپاچی یک منبع کتابخانه جاوا باز برای کار با اسناد PDF است. PDFBox تحت مجوز Apache مجوز دارد . [73]

چاپ

پردازشگرهای تصویر شطرنجی (RIP) برای تبدیل فایل‌های PDF به فرمت شطرنجی مناسب برای تصویربرداری روی کاغذ و سایر رسانه‌ها در چاپگرها، پرس‌های تولید دیجیتال و پیش‌چاپ در فرآیندی به نام شطرنجی استفاده می‌شوند . RIPهایی که قادر به پردازش PDF به طور مستقیم هستند شامل موتور چاپ Adobe PDF [74] از Adobe Systems and Jaws [75] و Harlequin RIP از Global Graphics است .

در سال 1993، پردازشگر تصویر شطرنجی Jaws از Global Graphics به اولین RIP پیش از چاپ ارسالی تبدیل شد که PDF را به صورت بومی و بدون تبدیل به فرمت دیگری تفسیر می کرد. این شرکت ارتقاء Harlequin RIP خود را با همان قابلیت در سال 1997 منتشر کرد. [76]

Agfa-Gevaert در سال 1997 Apogee، اولین سیستم گردش کار پیش از چاپ را بر اساس PDF، معرفی و ارسال کرد.

بسیاری از چاپگرهای افست تجاری ارسال فایل های PDF آماده چاپ را به عنوان منبع چاپ، به ویژه زیر مجموعه PDF/X-1a و انواع آن پذیرفته اند. [77] ارسال فایل های PDF آماده مطبوعات جایگزینی برای نیاز مشکل ساز برای دریافت فایل های کاری بومی جمع آوری شده است.

در سال 2006 PDF به عنوان فرمت استاندارد کار چاپ در اجلاس چاپ آزمایشگاه توسعه منبع باز پذیرفته شد . این به عنوان یک فرمت کار چاپ توسط سیستم چاپ یونیکس مشترک پشتیبانی می شود و پروژه های کاربردی دسکتاپ مانند GNOME ، KDE ، Firefox ، Thunderbird ، LibreOffice و OpenOffice به انتشار کارهای چاپی در PDF تغییر داده اند. [78]

برخی از چاپگرهای رومیزی از چاپ مستقیم PDF نیز پشتیبانی می کنند که می تواند داده های PDF را بدون کمک خارجی تفسیر کند.

مدل نمایشگر بومی

PDF به عنوان فرمت متافایل "بومی" برای Mac OS X انتخاب شد و جایگزین فرمت PICT سیستم عامل مک کلاسیک قبلی شد . مدل تصویربرداری لایه گرافیکی کوارتز بر اساس مدل رایج در Display PostScript و PDF است که منجر به نام مستعار Display PDF می شود . برنامه پیش‌نمایش می‌تواند فایل‌های PDF را نمایش دهد، مانند نسخه‌های 2.0 و جدیدتر Safariمرورگر اینترنت. پشتیبانی از PDF در سطح سیستم به برنامه‌های Mac OS X اجازه می‌دهد تا اسناد PDF را به‌طور خودکار ایجاد کنند، مشروط بر اینکه از معماری چاپ استاندارد OS پشتیبانی کنند. سپس فایل ها با فرمت PDF 1.3 مطابق با هدر فایل صادر می شوند. هنگام گرفتن اسکرین شات تحت سیستم عامل Mac OS X نسخه های 10.0 تا 10.3، تصویر به صورت PDF نیز گرفته می شد. نسخه‌های بعدی عکس‌های صفحه را به‌عنوان یک فایل PNG ذخیره می‌کنند، اگرچه در صورت تمایل می‌توان این رفتار را به PDF بازگرداند.

حاشیه نویسی

Adobe Acrobat یکی از نمونه‌های نرم‌افزار اختصاصی است که به کاربر اجازه می‌دهد به فایل‌های PDF از قبل ایجاد شده حاشیه‌نویسی، برجسته‌سازی و اضافه کردن یادداشت‌ها را انجام دهد. یکی از برنامه های کاربردی یونیکس که به عنوان نرم افزار رایگان (تحت مجوز عمومی عمومی گنو ) موجود است PDFedit است . نرم افزار رایگان نرم افزار Foxit Reader ، در دسترس برای مایکروسافت ویندوز ، MacOS در و لینوکس ، اجازه می دهد تا حاشیه نویسی اسناد. نمایشگر PDF-XChange نرم افزار Tracker اجازه می دهد تا حاشیه نویسی و نشانه گذاری را بدون محدودیت در جایگزین نرم افزار رایگان خود انجام دهد. اپل را از MacOSداره یکپارچه PDF بیننده، پیش نمایش، می کند همچنین حاشیه نویسی فعال به عنوان نشانی از نرم افزار منبع باز بدون چربی ، با تعامل حمایت از دومی با لاتک ، SyncTeX و PDFSync و ادغام با BibDesk نرم افزار مدیریت مرجع است. نرم افزار رایگان Qiqqa می تواند یک گزارش حاشیه نویسی ایجاد کند که تمام حاشیه نویسی ها و یادداشت هایی را که یک نفر در کتابخانه PDF خود ایجاد کرده است، خلاصه کند. ابزار تأیید متن، تفاوت های موجود در اسناد را به عنوان حاشیه نویسی و نشانه گذاری صادر می کند.

همچنین سیستم های حاشیه نویسی وب وجود دارند که از حاشیه نویسی در فرمت های pdf و سایر اسناد پشتیبانی می کنند. در مواردی که انتظار می‌رود فایل‌های PDF تمام قابلیت‌های اسناد کاغذی را داشته باشند، حاشیه‌نویسی جوهر مورد نیاز است.

جایگزین ها

گسترش XML مشخصات مقاله فرمت رقابت هم به عنوان یک زبان شرح صفحه و به عنوان قالب چاپ اسپولر بومی برای استفاده است مایکروسافت ویندوز از ویندوز ویستا .

Mixed Object: Document Content Architecture یک فرمت رقیب است. MO:DCA-P بخشی از Advanced Function Presentation است .

همچنین ببینید

منابع

  1. ^ a b نوع رسانه برنامه/pdf ، 2017، RFC 8118 
  2. ^ Adobe Systems Incorporated، مرجع PDF، نسخه ششم، نسخه 1.23 (53 مگابایت) ، نوامبر 2006، ص. 33.
  3. «پروژه کملوت» (PDF) .
  4. ^ "PDF چیست؟ فرمت سند قابل حمل | Adobe Acrobat DC" . www.adobe.com . بازیابی شده در 2021-09-17 .
  5. «ISO 32000-1:2008» (PDF) .
  6. «ISO 32000-1:2008 – مدیریت اسناد – قالب سند قابل حمل – قسمت 1: PDF 1.7» . Iso.org. 01-07-2008 . بازیابی شده در 2010-02-21 .
  7. Orion، Egan (2007-12-05). "PDF 1.7 به عنوان ISO 32000 تایید شده است . " پرسشگر . پرسشگر . بایگانی شده از نسخه اصلی در 13 دسامبر 2007 . بازیابی شده در 2007-12-05 .CS1 maint: unfit URL (link)
  8. ^ سیستم های ادوبی گنجانیده (2008)، مجوز ثبت اختراع عمومی، ISO 32000-1: 2008 - PDF 1.7 (PDF) ، بازیابی 2011/07/06
  9. «راهنمای تدارکات فناوری اطلاعات و ارتباطات مبتنی بر استاندارد - عناصر عملکرد خوب، در برابر قفل کردن: ایجاد سیستم‌های باز ICT با استفاده بهتر از استانداردها در تدارکات عمومی» . کمیسیون اروپایی. 25/06/2013 . بازیابی 2013-10-20 . مثال: ISO/IEC 29500، ISO/IEC 26300 و ISO 32000 برای فرمت های سند اطلاعات مرجعی که برای همه طرف ها قابل دسترسی نیست (اشاره به فناوری اختصاصی و نام های تجاری، دامنه ناقص یا پیوندهای وب مرده).
  10. ^ ISO/TC 171/SC 2/WG 8 N 603 - گزارش جلسه (PDF) ، 27-06-2011، بایگانی شده از نسخه اصلی (PDF) در 26-11-2012 ، XFA هنوز استاندارد ISO نیست. کمیته از Adobe Systems می‌خواهد تا مشخصات XFA، معماری فرم‌های XML (XFA) را برای استانداردسازی به ISO ارسال کند. کمیته نگران پایداری مشخصات XFA است که قسمت 2 به XFA 3.1 اشاره خواهد کرد.
  11. «جاسازی و انتشار فیگورهای علمی سه بعدی تعاملی در فایل‌های فرمت سند قابل حمل (PDF)» . doi : 10.1371/journal.pone.0069446.s001 . اجرای استاندارد U3D کامل نبود و از پسوندهای اختصاصی استفاده شد. Cite journal requires |journal= (help)
  12. لئونارد روزنتول، Adobe Systems (2012). "PDF و استانداردها" (PDF) . بایگانی شده از نسخه اصلی (PDF) در 02-09-2013 . بازیابی 2013-10-20 .
  13. ^ داف جانسون (10-06-2010)، آیا PDF یک استاندارد باز است؟ - Adobe Reader یک استاندارد واقعی است، نه PDF ، بایگانی شده از نسخه اصلی در 2016-04-16 ، بازیابی شده 2014-01-19
  14. «ISO 32000-2:2020 اکنون در دسترس است» . www.pdfa.org . بازیابی شده در 2021-02-03 .
  15. ^ a b "ISO 32000-2 - مدیریت اسناد - قالب سند قابل حمل - قسمت 2: PDF 2.0" . www.iso.org . بازیابی شده در 2021-02-03 .
  16. ^ "فرمت های سه بعدی پشتیبانی شده" . Adobe. 14/07/2009. بایگانی شده از نسخه اصلی در 2010-02-12 . بازیابی شده در 2010-02-21 .
  17. ^ "فرمت های فایل پشتیبانی شده در Acrobat و Reader" . helpx.adobe.com . بازیابی شده در 2020-03-22 .
  18. "JavaScript for Acrobat 3D | مرکز توسعه دهنده Adobe Acrobat" . www.adobe.com . بازیابی شده در 2020-03-22 .
  19. ^ پراوتز، جیم. "در دفاع از COS، یا چرا من JSON را دوست دارم و از XML متنفرم" . jimpravetz.com .
  20. ^ Adobe Systems، مرجع PDF، صفحات 39-40.
  21. ^ "اتصال برنامه نویس Adobe: مرجع PDF و برنامه های افزودنی Adobe به مشخصات PDF" . سیستم های Adobe . بازیابی شده 2010-12-13 .
  22. ^ هوارد، جاچی. "انتشار دسکتاپ: فونت های پایه 14 - تعریف" . About.com Tech . بایگانی شده از نسخه اصلی در ۱۴ ژوئن ۲۰۱۶.
  23. «آکواریوم فونت PDF» (PDF) .
  24. «مرجع PDF ویرایش ششم، نسخه 1.7، جدول 5.11» (PDF) .
  25. «ضمیمه حالت‌های ترکیب PDF» (PDF) .
  26. داف جانسون، 22 آوریل 2004 پی دی اف برچسب گذاری شده چیست؟
  27. ^ "آیا PDF قابل دسترسی است؟" . washington.edu .
  28. ^ "FreeMyPDF.com - رمزهای عبور را از فایل های PDF قابل مشاهده حذف می کند" . freemypdf.com .
  29. جرمی کرک (5 دسامبر 2008). "ادوبی اذعان دارد که حفاظت از رمز عبور PDF جدید ضعیف تر است" . Macworld به .
  30. برایان گیگنارد. "PDF چقدر امن است" (PDF) .
  31. «بررسی اجمالی امنیت PDF: نقاط قوت و ضعف» (PDF) .
  32. ^ a b c d e Adobe Systems Incorporated (2008-07-01), Document Management – ​​Format Document Portable – Part 1: PDF 1.7, First Edition (PDF) , بازیابی شده در 19/02/2010
  33. «وب‌سایت ناامنی PDF» . pdf-insecurity.org .
  34. "ISO 32000-1:2008 مدیریت اسناد -- قالب سند قابل حمل -- قسمت 1: PDF 1.7" . سازمان بین المللی استاندارد ISO . بازبینی شده در 22 مارس 2016 .
  35. "ETSI TS 102 778-1 V1.1.1 (2009-07): امضاها و زیرساخت های الکترونیکی (ESI)؛ پروفایل های امضای الکترونیکی پیشرفته PDF؛ قسمت 1: نمای کلی PAdES - یک سند چارچوب برای PAdES" (PDF) . استاندارد مخابرات اروپا ETSI . بازبینی شده در 22 مارس 2016 .
  36. «پیوندها و پیوست‌ها در فایل‌های PDF» .
  37. ^ مرجع Adobe PDF نسخه 1.7 ، بخش 10.2
  38. «آشنایی با Adobe Reader > درک تنظیمات برگزیده» . بازیابی شده در 2009-04-22 .
  39. «دسترسی به PDF» . WebAIM . بازیابی شده در 2010-04-24 .
  40. جو کلارک (۲۲-۰۸-۲۰۰۵). "حقایق و نظرات در مورد دسترسی به PDF" . بازیابی شده در 2010-04-24 .
  41. ^ "دسترسی و اسناد PDF" . مرکز دسترسی به وب بایگانی شده از نسخه اصلی در 2010-04-27 . بازیابی شده در 2010-04-24 .
  42. «استانداردهای دسترسی PDF نسخه 1.2» . بازیابی شده در 2010-04-24 .
  43. ^ دسترسی به PDF (PDF) ، دانشگاه ایالتی کالیفرنیا، بایگانی شده از نسخه اصلی (PDF) در 27/05/2010 ، بازیابی شده در 24/04/2010
  44. ^ راهنمای LibreOffice – صادرات به عنوان PDF ، بازیابی شده در 22/09/2012
  45. ^ صادرات PDF/A برای بایگانی طولانی مدت ، 11/01/2008
  46. Biersdorfer, JD (10-04-2009). "نکته هفته: ویژگی "Read Aloud" Adobe Reader" . نیویورک تایمز . بازیابی شده در 2010-04-24 .
  47. ^ دسترسی به اسناد PDF با فناوری کمکی: راهنمای کاربر صفحه‌خوان (PDF) ، Adobe ، بازیابی شده در 24/04/2010
  48. «Gnu PDF – PDF Knowledge – Forms Data Format» . بایگانی شده از نسخه اصلی در 01-01-2013 . بازیابی 2010-02-19 .
  49. «درباره فرم‌های PDF» . بایگانی شده از نسخه اصلی در 2011-04-29 . بازیابی 2010-02-19 .
  50. دملینگ، پیتر (1 ژوئیه 2008). "تبدیل فرم XFA به AcroForm؟" . بازیابی 2010-02-19 .
  51. «مهاجرت از فرم‌های Adobe Acrobat به فرم‌های XML» . بایگانی شده از نسخه اصلی در 2010-10-06 . بازیابی شده در 22-02-2010 .
  52. ^ a b XML Forms Data Format مشخصات، نسخه 2 (PDF) ، سپتامبر 2007، بایگانی شده از نسخه اصلی (PDF) در 2018-07-30 ، بازیابی شده در 2010-02-19
  53. «ISO 19444-1:2019(en)» . www.iso.org . بازیابی شده در 3 دسامبر 2020 .
  54. ^ Adobe Systems Incorporated (2007-10-15). "استفاده از فرم های آکروبات و داده های فرم در وب" . بازیابی 2010-02-19 .
  55. FDF Data Exchange Specification (PDF) ، 08-02-2007 ، بازیابی شده در 19-02-2010
  56. «منابع توسعه‌دهنده» . adobe.com . بایگانی شده از نسخه اصلی در 2016-02-27.
  57. ^ بازپرداخت 1 تریلیون دلاری: چگونه امضاهای PDF را جعل کنیم . CCS '19. کتابخانه دیجیتال ACM، کنفرانس ACM SIGSAC در مورد امنیت کامپیوتر و ارتباطات. 6 نوامبر 2019. صفحات 1-14. doi : 10.1145/3319535.3339812 . شابک 9781450367479. S2CID  199367545 .
  58. ^ رمزگشایی عملی exfiltration: شکستن رمزگذاری PDF . CCS '19. کتابخانه دیجیتال ACM، کنفرانس ACM SIGSAC در مورد امنیت کامپیوتر و ارتباطات. 6 نوامبر 2019. صفحات 15–29. doi : 10.1145/3319535.3354214 . شابک 9781450367479. S2CID  207959243 .
  59. «حملات سایه: پنهان کردن و جایگزینی محتوا در فایل‌های PDF امضاشده» . انجمن اینترنت، سمپوزیوم امنیت شبکه و سیستم توزیع شده.
  60. «پردازش مسیرهای خطرناک – در مورد امنیت و حریم خصوصی قالب سند قابل حمل» . انجمن اینترنت، سمپوزیوم امنیت شبکه و سیستم توزیع شده.
  61. «نقص سند قابل حمل 101» . کلاه سیاه.
  62. Adobe Forums, Announcement: PDF Attachment Virus "Peachy" ، 15 اوت 2001.
  63. «بولتن‌ها و توصیه‌های امنیتی» . Adobe . بازیابی شده در 2010-02-21 .
  64. «استیو گیبسون – پادکست SecurityNow» .
  65. «PDFهای مخرب کد را بدون آسیب‌پذیری اجرا می‌کنند» . پی سی مگ، . بایگانی شده از نسخه اصلی در 4 آوریل 2010.
  66. پاتک، خاموش (۱۶ مهر ۱۳۹۶). "نحوه ایجاد PDF از صفحه وب در iPhone و iPad در iOS 11" . آیفون انجمن . بازبینی شده در 2 فوریه 2018 .
  67. «شرح 2007 Microsoft Office Suite Service Pack 2 (SP2)» . مایکروسافت . بایگانی شده از نسخه اصلی در 29 آوریل 2009 . بازیابی شده در 2009-05-09 .
  68. ^ در تاریخ 02/04/2014، یادداشتی به تاریخ 10/02/2009 به پروژه‌های نرم‌افزار آزاد با اولویت بالا فعلی FSF به عنوان منبع اشاره کرد. با این حال، محتوای صفحه آخر در طول زمان تغییر می کند.
  69. ^ مشارکت کنندگان GNUpdf (2007-11-28). "اهداف و انگیزه ها" . gnupdf.org . GNUpdf . بازیابی شده در 02-04-2014 .CS1 maint: uses authors parameter (link)
  70. لی، مت (2011-10-06). "پروژه PDF گنو از لیست پروژه های با اولویت FSF خارج شد؛ ماموریت کامل شد!" . fsf.org . بنیاد نرمافزار آزاد . بازیابی شده در 02-04-2014 .
  71. ^ صفحه اصلی Poppler "Poppler یک کتابخانه رندر PDF بر اساس کد پایه xpdf-3.0 است." (آخرین بررسی در 10/02/2009)
  72. ^ مجوز Xpdf "Xpdf تحت مجوز عمومی عمومی گنو (GPL)، نسخه 2 یا 3 مجوز دارد." (آخرین بررسی در 23/09/2012).
  73. ^ پروژه Apache PDFBox . بازیابی 2009-09-19.
  74. ^ "Adobe PDF Print Engine" . adobe.com .
  75. «Jaws® 3.0 PDF and PostScript RIP SDK» . globalgraphics.com . بایگانی شده از نسخه اصلی در 2016-03-05 . بازیابی شده در 2010-11-26 .
  76. «Harlequin MultiRIP» . بایگانی شده از نسخه اصلی در 2014-02-09 . بازیابی شده در 2014-03-02 .
  77. ^ فایل های PDF آماده مطبوعاتی "برای هر کسی که علاقه مند به چاپ تجاری پروژه گرافیکی خود مستقیماً از فایل های دیجیتال یا PDF است." (آخرین بررسی در 10/02/2009).
  78. «PDF به عنوان قالب کار چاپ استاندارد» . بنیاد لینوکس . بنیاد لینوکس . بازبینی شده در 21 ژوئن 2016 .

ادامه مطلب

پیوندهای خارجی