ЕГЭ и ОГЭ
Хочу знать
Главная > Математика > Прикладная статистика: Основы моделирования и первичная обработка данных
<< Предыдущий параграф
Следующий параграф >>
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

12.1.1. Организация пакетов программ.

Можно выделить следующие уровни в организации пакетов программ.

Первым уровнем организации пакета является пакет простой структуры, представляющий собой библиотеку модулей, под которыми здесь понимается процедура, подпрограмма или программа на языке программирования высокого уровня (ФОРТРАН, ПЛ/1), удовлетворяющие некоторым дополнительным ограничениям, наличие которых обеспечивает концептуальное единство пакета. Наиболее важными ограничениями такого рода являются ограничения на структуру размещения в памяти основных информационных единиц, необходимые для согласования входных и выходных данных различных модулей. Например, требуется, чтобы матрица данных на входе всех модулей, ее использующих, представлялась в виде двумерного массива с расположением объектов по строкам (или по столбцам). Другие ограничения связаны со способами передачи информации (например, допустимость или запрет переменных внешнего типа), с использованием операторов ввода-вывода, со способом аварийного завершения работы модуля. Подпрограммы в этих пакетах имеют также согласованную документацию. Пакет простой структуры может использоваться как в виде библиотеки исходных модулей (на программном языке высокого уровня), так и в виде библиотеки загрузочных модулей, полученных в результате компиляции и редактирования соответствующих исходных модулей. Примером пакета простой структуры является Пакет научных подпрограмм (ПНП) на Фортране для ЕС ЭВМ [55], поставляемый обычно именно в виде загрузочных модулей. Описания интересующих нас разделов ПНП содержатся в [вып. 2], [вып. 10]. Разработан и аналог ПНП на ПЛ/1 (см. [вып. 14]). Прообразом для версии ПНП на Фортране явился пакет SSP фирмы IBM, а для версии ПНП на ПЛ/1 — версия SSP на ПЛ/1. В настоящее время состав процедур по ПС в ПНП существенно расширен по сравнению с исходными пакетами SSP, особенно в области обработки многомерных данных.

Помимо чисто статистичеcких программ, эти пакеты содержат еще подпрограммы из многих других разделов вычислительной математики — линейной алгебры, интерполяции и экстраполяции табличных функций и т. д.

Использование пакета простой структуры требует от пользователя достаточно хорошей программистской подготовки и состоит в отборе подходящих модулей и в ручном (т. е. осуществляемом самим пользователем) составлении головной программы на языке программирования высокого уровня, организующей вызов отобранных модулей в определенном порядке, размещение и ввод-вывод данных. Язык пользователя на этом уровне образует язык программирования высокого уровня (Фортран, ПЛ/1), язык обращения к операционной системе и языковые средства, введенные самим пользователем для управления созданной программой.

Существенно более высокий уровень организации представляют собой пакеты, состоящие из набора программ, готовых к выполнению, управляемых единым для всех программ входным проблемно-ориентированным языком и имеющих унифицированный ввод-вывод данных. На этом уровне организации появляется возможность создания сравнительно просто управляемых средств манипуляции с данными, их ведения и документирования.

Программы пакета составлены из модулей, которые, как правило, берутся из библиотеки модулей, организованной, как описано выше (пакет простой структуры). Для уменьшения требуемых ресурсов основной памяти программы обычно имеют оверлейную структуру.

Внесение изменений для пользователя в такие программы практически невозможно, за исключением предусмотренных заранее случаев изменения допустимого объема памяти, отводимой под данные, и включения по определенным правилам некоторых процедур пользователя на языке Фортран или ПЛ/1, например для преобразований признаков. Тем не менее благодаря наличию гибкого входного языка и возможности просто составлять многоэтапные процедуры обработки из последовательности программ пакета такие пакеты позволяют удовлетворить подавляющую часть потребностей пользователя по обработке данных.

В то же время сами эти пакеты влияют на ход статистического исследования, определяя составом допустимых процедур и требованиями на входные данные форму подготовки и, в значительной степени, сбора и накопления данных. Работа с таким пакетом доступна пользователю, не обладающему подготовкой в области программирования, хотя обычно необходимо знание некоторого минимального объема языковых средств для общения с операционной системой.

Одним из известных пакетов такого типа является BMDP, разработанный в США. Мы будем рассматривать далее две версии этого пакета — версию 1975 г. [99], адаптированную в СССР для ЕС ЭВМ, и версию 1979 г. [100], существенно расширенную по сравнению с версией 1975 г. Далее для обозначения соответствующих версий будем писать BMDP 75 и BMDP 79.

Другим пакетом такого рода является пакет Программ по прикладному статистическому анализу (ППСА) [67], разработанный в ЦЭМИ АН СССР. Пакет ППСА отличается от BMDP составом реализованных методов обработки, входным языком, организацией и документированием данных, а также организацией программ. Если в BMDP каждая программа реализует только один метод обработки, то ППСА использует тематически-ориентированные (ТО) программы [9]. Каждая из ТО-программ, по существу, является пакетом программ для решения некоторого подмножества задач ПС (оценивания, регрессионного, дискриминантного анализов и т. д.). Подмножества модулей, используемые различными ТО-программами, частично пересекаются. Так, все программы эксплуатируют одни и те же модули ввода и трансляции предложений входного языка, ввода данных, вывода данных в виде таблиц и графиков и т. д. Организация связей между модулями в ТО-программе позволяет создавать простую оверлейную структуру. Во многих случаях использование ТО-программ уменьшает затраты усилий пользователя по созданию многоэтапных процедур обработки,

Дальнейшим развитием концепции ТО-программ (в отношении способа организации пакета программ, но не исторически) являются пакеты программ, у которых последовательность необходимых процедур обработки создается на основе анализа предложений входного языка пакета, описывающего задание пользователя. Способы реализации этого подхода могут быть самыми различными.

Из зарубежных пакетов к этому типу относятся, например, пакеты P-STAT [132], SPSS [135], а из пакетов, разработанных в нашей стране, — СОД-ГС [68], ОТЭКС [66].

Внешне, для пользователя, работа с пакетами такого типа организации мало отличается от работы с пакетами типа BMDP или ППСА. Поэтому в дальнейшем эти способы организации пакетов мы различать не будем, именуя условно пакеты из обеих групп просто пакеты программ и отличая их от пакетов (библиотек) подпрограмм типа ПНП. Все упомянутые выше пакеты предназначены для ЕС ЭВМ или IBM-380/370. Исключение представляет версия ПНП на Фортране, которая может быть использована (в виде исходных модулей) на ЭВМ БЭСМ-6 и «Минск-32». Из пакетов программ, предназначенных для БЭСМ-6, отметим пакет СОРРА-1, направленный для решения задач многомерной классификации и регрессии, и пакет DIAS [82].

<< Предыдущий параграф Следующий параграф >>
Оглавление