]> git.cworth.org Git - fips/log
fips
11 years agoPush oustanding-counter data down from context.c into metrics.c
Carl Worth [Mon, 4 Nov 2013 22:06:06 +0000 (14:06 -0800)]
Push oustanding-counter data down from context.c into metrics.c

Here, we introduce a new metrics_t structure which is responsible for
kepping track of lists of outstanding counters as well as the array of
collected counter results.

Now, context_t is much cleaner, containing only the ID of the system
context, the metric_info_t and the metrics_t.

11 years agocontext: Avoid doing excessive work if application re-sets the same context
Carl Worth [Mon, 4 Nov 2013 21:40:32 +0000 (13:40 -0800)]
context: Avoid doing excessive work if application re-sets the same context

I've heard rumors that firefox (at least as of some version) had a
tendency to call glXMakeCurrent with the current context on every frame.

As of this commit, fips will notice the current context being set with
MakeCurrent and will do not tear things down and re-create them in
this case.

11 years agoxmalloc: Add xcalloc wrapper for calloc
Carl Worth [Mon, 4 Nov 2013 21:40:06 +0000 (13:40 -0800)]
xmalloc: Add xcalloc wrapper for calloc

Some code will be wanting to use this soon.

11 years agoBegin re-factoring metrics.c into separate context.c and metrics-info.c
Carl Worth [Mon, 4 Nov 2013 21:21:13 +0000 (13:21 -0800)]
Begin re-factoring metrics.c into separate context.c and metrics-info.c

The code in metrics.c was getting a bit unwieldy. Some of it is pushed
up into the existing context.c file. Other portions (specifically, the
code which queries the names of all available performance monitors) is
pushed down into a new metrics-info.c.

There's not yet very hard boundaries between these files yet, (they
are all sharing their internals in header files), but this gives some
structure for future cleanups.

11 years agoCollect any available results before switching contexts.
Carl Worth [Wed, 30 Oct 2013 21:39:47 +0000 (14:39 -0700)]
Collect any available results before switching contexts.

Rather than missing out on any measured results by just throwing them
away, we collect anything that is ready.

This way, if any queries don't actually have results ready, we will
throw those away, since we're not going to be able to get a meaningful
result from them with the current context going away.

11 years agometrics: Fix to not try to call into OpenGL at atexit time.
Carl Worth [Thu, 31 Oct 2013 23:15:05 +0000 (16:15 -0700)]
metrics: Fix to not try to call into OpenGL at atexit time.

This could lead to all kinds of problems since the OpenGL call should
be long-gone by the time of atexit.

11 years agoFix resource leaks when switching contexts.
Carl Worth [Wed, 30 Oct 2013 21:35:21 +0000 (14:35 -0700)]
Fix resource leaks when switching contexts.

Previously, fips was already freeing memory that it had allocated for
its own linked lists of outstanding queries when switching contexts.

In addition, in this commit, we also now call End on any active
timer-query/performance-monitor and then call Delete on all queries
for which we have not previously collected results.

This avoids leaks within the OpenGL implementation as it holds on to
results that fips will never ask for.

11 years agoCollect timer/monitor results whenever there are >1000 outstanding
Carl Worth [Wed, 30 Oct 2013 21:24:52 +0000 (14:24 -0700)]
Collect timer/monitor results whenever there are >1000 outstanding

Previously, fips always waited for a frame boundary before collecting
timer and monitor results. Now, whenever more than a maximum (set to
1000 here) number of monitors have been fired off, but no results
collected, fips will check and collect results for all timers/monitors
that have results available.

Here's some background on the debugging that led to this change:

  With an apitrace collected from "DOTA 2" we ran into crashes, always
  on the first frame of the game proper (after the opening menus,
  etc.). This frame is unusually large, (roughly half a million OpenGL
  calls).

  With that large frame, and the resulting large number of outstanding
  queries waiting to be collected, we were running into a resource
  limit and Mesa's performance-monitor code was crashing on an
  unexpectedly NULL bo->virtual pointer.

  A little digging determined that a DRM map ioctl was failing due to
  the map_count resource in the kernel being larger than the
  configured default (roughly 65530).

  After checking that neither fips nor Mesa was leaking any large
  number of buffer objects, (nor keeping many mapped), we decided to
  attempt this more aggressive collection of results in fips.

  As far as resource consumption in general, this does seem like a
  reasonable thing to do. If we have hundreds of outstanding queries,
  surely the oldest of them have completed, and we can free some
  resources by collecting those.

  On the other hand, it still seems wrong that the kernel is imposing
  an arbitrary limit on how many outstanding queries an application
  can have. The AMD_performance_monitor specification and
  implementation are not intended to have any such limitation. So,
  there's still some investigation to be done on what resource is
  causing the kernel's map_count to grow so large and to see if
  there's a bug there to be fixed.

11 years agoPrint reports every 15 frames rather than every 60
Carl Worth [Thu, 31 Oct 2013 22:39:55 +0000 (15:39 -0700)]
Print reports every 15 frames rather than every 60

This really should be a command-line value (or environement variable)
of course.

11 years agoFix to print metrics for operations with no per-stage cycle counts
Carl Worth [Thu, 31 Oct 2013 22:35:39 +0000 (15:35 -0700)]
Fix to print metrics for operations with no per-stage cycle counts

Operations like glTexImage* get a valid time from the timer query, but
get performance counter numbers of zero, (since the operation is
performed in a blit batch which cannot have performance-monitor
operations in it).

We had code in place to protect any divide-by-zero in this case, but
that case was mistakenly setting the resulting time to 0, so any
operations like this were not having their time reported.

To fix this, we can't compute any per-stage time, so we arbitrarily
use stage 0 as the place to store 100% of the time spent, but we
update this per-stage metric value to point to a NULL per-stage name
to avoid any lie in the report.

11 years agometrics: Cosmetic change to prefer ctx over current_context
Carl Worth [Thu, 31 Oct 2013 21:31:10 +0000 (14:31 -0700)]
metrics: Cosmetic change to prefer ctx over current_context

Just making it less typing to get at the current context.

11 years agoAdd a new context.c file with context_enter and context_leave functions
Carl Worth [Mon, 28 Oct 2013 21:34:26 +0000 (14:34 -0700)]
Add a new context.c file with context_enter and context_leave functions

So far, this just factors out some duplicated code from glxwrap.c and
eglwrap.c into the new context_enter/leave functions.

Eventually, some of the code currently living in metrics.c should
migrate up into context.c, (such as the global current_context
variable in metrics.c).

Additionally, the context.c layer will give us a natural place to
query things such as "is the AMD_performance_monitor extension
available?".

11 years agodispatch: Fix dispatcher to perform lookup for the GetProcAddress functions
Carl Worth [Fri, 25 Oct 2013 22:12:25 +0000 (15:12 -0700)]
dispatch: Fix dispatcher to perform lookup for the GetProcAddress functions

Previously, the fips dispatch code was directly calling
glxGetProcAddressARB and eglGetProcAddress. This meant that the
dispatch code was calling into fips's own version of these functions.

Up until now, that has worked fine, since fips was not implementing
wrappers for any of the functions supported by fips-dispatch, so
fips's GetProcAddress functions were successfully calling the "real"
GetProcAddress functions and the dispatch code was calling the real
functions.

However, we're about to start adding wrappers for functions that are
also dispatched, (such as glBeginQuery). At this point, it would be
incorrect for the dispatch code to return the fips-wrapped
versions. The whole point of wrapping these functions is to make the
application calls into these functions different than the fips calls
into the real functions (through the dispatch).

To fix this, we ensure that the dispatch code calls glwrap_lookup or
eglwrap_lookup to locate the "real" GetProcAddress functions which in
turn ensures that the dispatch code will never resolve to a wrapped
function.

11 years agoFix buffer overrun in accumulate_program_metrics
Carl Worth [Fri, 25 Oct 2013 22:34:17 +0000 (15:34 -0700)]
Fix buffer overrun in accumulate_program_metrics

The convention for the op_metrics array in the context is that callers
do not index it directly, but instead call ctx_get_op_metrics (which
will grow tha array if needed first).

12 years agoCleanup outstanding counters at context change.
Carl Worth [Thu, 24 Oct 2013 02:47:20 +0000 (19:47 -0700)]
Cleanup outstanding counters at context change.

Without this, and given an application that calls glxMakeCurrent (or
similar) the implementation gets quite confused as fips starts
requesting query results for counter IDs that were only valid for the
previous context.

12 years agoAdd support for performance counters of types other than uint32_t
Carl Worth [Wed, 23 Oct 2013 16:23:44 +0000 (09:23 -0700)]
Add support for performance counters of types other than uint32_t

The AMD_performance_monitor extension also allows counters of type
uin64_t, float, and percentage (which is the same data-type as float).

Fips was already storing the expected type in the group's
counter_types array, so it's a simple matter to look at that and read
a value of the expected type.

12 years agoTrack glext.h ABI changes
Carl Worth [Wed, 23 Oct 2013 21:06:22 +0000 (14:06 -0700)]
Track glext.h ABI changes

I cannot fathom why some internalFormat values changed from GLenum to
GLint while others changed from GLint to GLenum. But, fortunately,
glext.h includes a version field so that we can track this.

12 years agoFix conversion from group IDs to group array indices.
Kenneth Graunke [Wed, 23 Oct 2013 19:38:37 +0000 (12:38 -0700)]
Fix conversion from group IDs to group array indices.

The loop that found the array index for a particular group based on the
group ID had a subtle bug: it compared against "i" instead of group_id.

In the i965 implementation, the first group happens to have ID 0, which
meant that the loop would always select the first group (since the ID
equals the array index).  This led to assertion failures about the
number of counters in each group.

Signed-off-by: Kenneth Graunke <kenneth@whitecape.org>
12 years agoPerform reporting on a per-shader-stage basis
Carl Worth [Wed, 23 Oct 2013 03:25:56 +0000 (20:25 -0700)]
Perform reporting on a per-shader-stage basis

We use the per-shader-stage performance counters to determine a
relative portion of time that each operation spends in each shader
stage. These portions are then used to multiply the time measured (via
timer query) for each operation to determine a per-shader time. Then,
all the per-shader-stage operations are sorted by these computed times
and printed in the report.

We also print a "% active" value for each shader stage.

The remaining performance counters (other than per-stage active and
stall) are now no longer printed by default. If these are desired,
they can be obtained by passing the --verbose option to the fips
binary or by setting the FIPS_VERBOSE environment variable to a value
of 1.

 } metrics_group_info_t;

+typedef struct shader_stage_info
+{
+ char *name;
+
+ GLuint active_group_index;
+ GLuint active_counter_index;
+
+ GLuint stall_group_index;
+ GLuint stall_counter_index;
+
+} shader_stage_info_t;
+
 typedef struct metrics_info
 {
  int initialized;

  unsigned num_groups;
  metrics_group_info_t *groups;
+
+ unsigned num_shader_stages;
+ shader_stage_info_t *stages;
+
 } metrics_info_t;

 typedef struct context
@@ -187,10 +203,74 @@ metrics_group_info_fini (metrics_group_info_t *group)
 static void
 metrics_info_fini (metrics_info_t *info);

+/* A helper function, part of metrics_info_init below. */
+
+typedef enum {
+ SHADER_ACTIVE,
+ SHADER_STALL
+} shader_phase_t;
+
+static void
+_add_shader_stage (metrics_info_t *info, const char *name,
+    GLuint group_index, GLuint counter_index,
+    shader_phase_t phase)
+{
+ shader_stage_info_t *stage;
+ char *stage_name, *space;
+ unsigned i;
+
+ stage_name = xstrdup (name);
+
+ /* Terminate the stage name at the first space.
+  *
+  * This is valid for counter names such as:
+  *
+  * "Vertex Shader Active Time"
+  * or
+  * "Vertex Shader Stall Time - Core Stall"
+  */
+ space = strchr (stage_name, ' ');
+ if (space)
+ *space = '\0';
+
+ /* Look for an existing stage of the given name. */
+ stage = NULL;
+
+ for (i = 0; i < info->num_shader_stages; i++) {
+ if (strcmp (info->stages[i].name, stage_name) == 0) {
+ stage = &info->stages[i];
+ break;
+ }
+ }
+
+ if (stage == NULL) {
+ info->num_shader_stages++;
+ info->stages = xrealloc (info->stages,
+  info->num_shader_stages *
+  sizeof (shader_stage_info_t));
+ stage = &info->stages[info->num_shader_stages - 1];
+ stage->name = xstrdup (stage_name);
+ stage->active_group_index = 0;
+ stage->active_counter_index = 0;
+ stage->stall_group_index = 0;
+ stage->stall_counter_index = 0;
+ }
+
+ if (phase == SHADER_ACTIVE) {
+ stage->active_group_index = group_index;
+ stage->active_counter_index = counter_index;
+ } else {
+ stage->stall_group_index = group_index;
+ stage->stall_counter_index = counter_index;
+ }
+
+ free (stage_name);
+}
+
 void
 metrics_info_init (void)
 {
- unsigned i;
+ unsigned i, j;
  GLuint *group_ids;
  metrics_info_t *info = &current_context.metrics_info;

@@ -210,6 +290,28 @@ metrics_info_init (void)

  free (group_ids);

+ /* Identify each shader stage (by looking at
+  * performance-counter names for specific patterns) and
+  * initialize structures referring to the corresponding
+  * counter numbers for each stage. */
+ info->num_shader_stages = 0;
+ info->stages = NULL;
+
+ for (i = 0; i < info->num_groups; i++) {
+ metrics_group_info_t *group = &info->groups[i];
+ for (j = 0; j < group->num_counters; j++) {
+ char *name = group->counter_names[j];
+ if (strstr (name, "Shader Active Time")) {
+ _add_shader_stage (info, name, i, j,
+    SHADER_ACTIVE);
+ }
+ if (strstr (name, "Shader Stall Time")) {
+ _add_shader_stage (info, name, i, j,
+    SHADER_STALL);
+ }
+ }
+ }
+
  info->initialized = 1;
 }

@@ -222,6 +324,11 @@ metrics_info_fini (metrics_info_t *info)
  metrics_group_info_fini (&info->groups[i]);

  free (info->groups);
+
+ for (i = 0; i < info->num_shader_stages; i++)
+ free (info->stages[i].name);
+
+ free (info->stages);
 }

 static const char *
@@ -453,54 +560,95 @@ accumulate_program_time (metrics_op_t op, unsigned time_ns)
  metrics->time_ns += time_ns;
 }

+typedef struct per_stage_metrics
+{
+ op_metrics_t *metrics;
+ shader_stage_info_t *stage;
+ double time_ns;
+ double active;
+} per_stage_metrics_t;
+
 static int
-time_compare(const void *in_a, const void *in_b, void *arg)
+_is_shader_stage_counter (metrics_info_t *info,
+   unsigned group_index,
+   unsigned counter_index)
 {
- int a = *(const int *)in_a;
- int b = *(const int *)in_b;
- struct op_metrics *metrics = arg;
+ shader_stage_info_t *stage;
+ unsigned i;
+
+ for (i = 0; i < info->num_shader_stages; i++) {
+ stage = &info->stages[i];
+
+ if (stage->active_group_index == group_index &&
+     stage->active_counter_index == counter_index)
+ {
+ return 1;
+ }
+
+ if (stage->stall_group_index == group_index &&
+     stage->stall_counter_index == counter_index)
+ {
+ return 1;
+ }
+ }

- if (metrics[a].time_ns < metrics[b].time_ns)
- return -1;
- if (metrics[a].time_ns > metrics[b].time_ns)
- return 1;
  return 0;
 }

 static void
-print_op_metrics (context_t *ctx, op_metrics_t *metric, double total)
+print_per_stage_metrics (context_t *ctx,
+  per_stage_metrics_t *per_stage,
+  double total)
 {
  metrics_info_t *info = &ctx->metrics_info;
+ op_metrics_t *metric = per_stage->metrics;
  metrics_group_info_t *group;
  const char *op_string;
- unsigned i, group_index, counter;
+ unsigned group_index, counter;
  double value;

- /* Since we sparsely fill the array based on program
-  * id, many "programs" have no time.
-  */
- if (metric->time_ns == 0.0)
+ /* Don't print anything for stages with no alloted time. */
+ if (per_stage->time_ns == 0.0)
  return;

  op_string = metrics_op_string (metric->op);

- printf ("%s", op_string);
+ printf ("%21s", op_string);
+
  if (metric->op >= METRICS_OP_SHADER) {
- printf (" %d:", metric->op - METRICS_OP_SHADER);
+ printf (" %3d", metric->op - METRICS_OP_SHADER);
  } else {
- printf (":");
- for (i = strlen (op_string); i < 20; i++)
- printf (" ");
+ printf ("    ");
+
  }
+ printf (" %cS:", per_stage->stage->name[0]);

- printf ("\t%7.2f ms (% 2.1f%%)",
- metric->time_ns / 1e6,
- metric->time_ns / total * 100);
+ printf ("\t%7.2f ms (%4.1f%%)",
+ per_stage->time_ns / 1e6,
+ per_stage->time_ns / total * 100);
+
+ if (per_stage->active)
+ printf (", %4.1f%% active", per_stage->active * 100);
+
+ printf ("\n");
+
+ /* I'm not seeing a lot of value printing the rest of these
+  * performance counters by default yet. Use --verbose to get
+  * them for now. */
+ if (! verbose)
+ return;

  printf ("[");
  for (group_index = 0; group_index < info->num_groups; group_index++) {
  group = &info->groups[group_index];
  for (counter = 0; counter < group->num_counters; counter++) {
+
+ /* Don't print this counter value if it's a
+  * per-stage cycle counter, (which we have
+  * already accounted for). */
+ if (_is_shader_stage_counter (info, group_index, counter))
+ continue;
+
  value = metric->counters[group_index][counter];
  if (value == 0.0)
  continue;
@@ -511,27 +659,97 @@ print_op_metrics (context_t *ctx, op_metrics_t *metric, double total)
  printf ("]\n");
 }

+static int
+time_compare(const void *in_a, const void *in_b, void *arg unused)
+{
+ const per_stage_metrics_t *a = in_a;
+ const per_stage_metrics_t *b = in_b;
+
+
+ if (a->time_ns < b->time_ns)
+ return -1;
+ if (a->time_ns > b->time_ns)
+ return 1;
+ return 0;
+}
+
 static void
 print_program_metrics (void)
 {
  context_t *ctx = &current_context;
- int *sorted; /* Sorted indices into the ctx->op_metrics */
- double total = 0;
- unsigned i;
-
- /* Make a sorted list of the operations by time used, and figure
-  * out the total so we can print percentages.
+ metrics_info_t *info = &ctx->metrics_info;
+ unsigned num_shader_stages = info->num_shader_stages;
+ per_stage_metrics_t *sorted, *per_stage;
+ double total_time, op_cycles;
+ op_metrics_t *op;
+ unsigned group_index, counter_index;
+ unsigned i, j, num_sorted;
+
+ /* Make a sorted list of the per-stage operations by time
+  * used, and figure out the total so we can print percentages.
   */
- sorted = calloc(ctx->num_op_metrics, sizeof(*sorted));
+ num_sorted = ctx->num_op_metrics * num_shader_stages;
+
+ sorted = xmalloc (sizeof (*sorted) * num_sorted);
+
+ total_time = 0.0;
+
  for (i = 0; i < ctx->num_op_metrics; i++) {
- sorted[i] = i;
- total += ctx->op_metrics[i].time_ns;
+
+ op = &ctx->op_metrics[i];
+
+ /* Accumulate total time across all ops. */
+ total_time += op->time_ns;
+
+ /* Also, find total cycles in all stages of this op. */
+ op_cycles = 0.0;
+
+ for (j = 0; j < num_shader_stages; j++) {
+ /* Active cycles */
+ group_index = info->stages[j].active_group_index;
+ counter_index = info->stages[j].active_counter_index;
+ op_cycles += op->counters[group_index][counter_index];
+
+ /* Stall cycles */
+ group_index = info->stages[j].stall_group_index;
+ counter_index = info->stages[j].stall_counter_index;
+ op_cycles += op->counters[group_index][counter_index];
+ }
+
+ for (j = 0; j < num_shader_stages; j++) {
+ double active_cycles, stall_cycles, stage_cycles;
+
+ /* Active cycles */
+ group_index = info->stages[j].active_group_index;
+ counter_index = info->stages[j].active_counter_index;
+ active_cycles = op->counters[group_index][counter_index];
+
+ /* Stall cycles */
+ group_index = info->stages[j].stall_group_index;
+ counter_index = info->stages[j].stall_counter_index;
+ stall_cycles = op->counters[group_index][counter_index];
+
+ stage_cycles = active_cycles + stall_cycles;
+
+ per_stage = &sorted[i * num_shader_stages + j];
+ per_stage->metrics = op;
+ per_stage->stage = &info->stages[j];
+ if (op_cycles)
+ per_stage->time_ns = op->time_ns * (stage_cycles / op_cycles);
+ else
+ per_stage->time_ns = 0.0;
+ if (stage_cycles)
+ per_stage->active = active_cycles / stage_cycles;
+ else
+ per_stage->active = 0.0;
+ }
  }
- qsort_r(sorted, ctx->num_op_metrics, sizeof(*sorted),
- time_compare, ctx->op_metrics);

- for (i = 0; i < ctx->num_op_metrics; i++)
- print_op_metrics (ctx, &ctx->op_metrics[sorted[i]], total);
+ qsort_r (sorted, num_sorted, sizeof (*sorted),
+  time_compare, ctx->op_metrics);
+
+ for (i = 0; i < num_sorted; i++)
+ print_per_stage_metrics (ctx, &sorted[i], total_time);

  free (sorted);
 }
@@ -561,9 +779,6 @@ metrics_end_frame (void)
  initialized = 1;
  }

- if (verbose)
- printf ("fips: frame %d complete\n", frames);
-
  frames++;
  gettimeofday (&tv_now, NULL);

12 years agoPrefer "info" over "metrics_info" for variable name.
Carl Worth [Wed, 23 Oct 2013 01:53:31 +0000 (18:53 -0700)]
Prefer "info" over "metrics_info" for variable name.

All other functions were already using the shorter name. This one had
the longer name for some reason, which made it a bit more awkward to
read.

12 years agoFix for an implementation with non-contiguous group ID values.
Carl Worth [Wed, 23 Oct 2013 01:47:40 +0000 (18:47 -0700)]
Fix for an implementation with non-contiguous group ID values.

It seems crazy to me that group IDs (being integers) can be anything
other than [0 .. num_groups - 1], but the specification is written
with full generality here.

The code was already querying the group ID values originally, and
assigning those to each group->id slot in the metric_group_info_t
structure. But after that, the code had been assuming it could just
use values from 0 .. num_groups-1.

Fix this by carefully using group_index values ([0..num_groups-1])
when indexing into the various arrays and group->id values when
passing ID values to the various performance-monitor API functions.

12 years agoFree all fip-allocated data when the program exits
Carl Worth [Wed, 23 Oct 2013 00:44:04 +0000 (17:44 -0700)]
Free all fip-allocated data when the program exits

This isn't strictly necessary since the operating system is about to
reclaim all of this data anyway.

The only real advantage of doing this is that it enables us to see in
a valgrind report that there aren't any memory leaks due to direct
allocation by code within fips.

12 years agoClose two memory leaks in fips metrics reporting.
Carl Worth [Wed, 23 Oct 2013 00:43:31 +0000 (17:43 -0700)]
Close two memory leaks in fips metrics reporting.

Thanks to valgrind for pointing these out.

12 years agoPrint performance-counter names in report
Carl Worth [Wed, 23 Oct 2013 00:23:46 +0000 (17:23 -0700)]
Print performance-counter names in report

This isn't necessarily a very useful way to see the numbers. The
important part of the code here is that fips is now querying the names
so that it can do some useful interpretation of the values based on
the names.

12 years agoUn-nest an inner loop while printing program metrics
Carl Worth [Tue, 22 Oct 2013 23:30:34 +0000 (16:30 -0700)]
Un-nest an inner loop while printing program metrics

Before we add more code to complicate the way we print performance
counters, it helps to have this code in its own function, (where we
can safely use 'i' instead of 'j' for loop-control variable, etc.).

12 years agofips-dispatch: Fix misspelled glGetPerfMonitorGroupStringAMD
Carl Worth [Tue, 22 Oct 2013 23:29:15 +0000 (16:29 -0700)]
fips-dispatch: Fix misspelled glGetPerfMonitorGroupStringAMD

There was an extra 's' in here before (GroupsString instead of
GroupString), preventing these functions from being used
correctly. Fix this, (since fips will soon be using this function).

12 years agoRespect GLAZE_LIBGL environment variable (if FIPS_LIBGL is unset)
Carl Worth [Tue, 22 Oct 2013 19:19:37 +0000 (12:19 -0700)]
Respect GLAZE_LIBGL environment variable (if FIPS_LIBGL is unset)

Since the LD_PRELOAD mechanism of fips may not work with some
programs, users may want to run fips within glaze instead, (which uses
LD_LIBRARY_PATH instead of LD_PRELOAD). In order to make this
convenient, fips can recognize that glaze has identified the
appropriate libGL.so library by examining the GLAZE_LIBGL environment
variable.

So, if the user has not specifically set the FIPS_LIBGL variable, and
the GLAZE_LIBGL variable is set, use it to find the libGL.so to load.

12 years agoEnsure that the name "fips" appears in all error messages.
Carl Worth [Tue, 22 Oct 2013 19:18:23 +0000 (12:18 -0700)]
Ensure that the name "fips" appears in all error messages.

With the number of wrappers potentially involved, (fips, glaze,
apitrace, etc.), sometimes it can be ambiguous which error messages
belong to which wrappers.

Ensure that fips, at least, always advertises its own name in its
error messages.

12 years agoAdd collection of (AMD_performance_monitor) performance counters to fips
Carl Worth [Tue, 22 Oct 2013 18:04:25 +0000 (11:04 -0700)]
Add collection of (AMD_performance_monitor) performance counters to fips

The implementation involves a linked-list of outstanding
performance-monitor queries next to the existing list of outstanding
timer queries.

The results from the performance counters are stored (without any
interpretation in an array of values next to the existing time values
within each op_metrics_t value for each operation.

The numbers are currently printed with simple counter numbers (no
names and no units) and with the values divided by 1e6. Counters with
values of zero are not printed.

Next steps from here that will make things useful:

1. Use relative number of cycels in each stage to apportion measured
   shader time among the various stages, (so that per-stage time
   numbers are sorted in the final report).

2. Print percentage active, (by looking at per-stage active and stall times)

3. Print names for counters (other than per-stage active and stall
   which will be used in the above two calculations).

4. Fix to silently ignore performance counters if the
   AMD_performance_monitor extension is not available.

12 years agofips-dispatch: Add support for AMD_performance_monitor extension
Carl Worth [Tue, 22 Oct 2013 17:46:04 +0000 (10:46 -0700)]
fips-dispatch: Add support for AMD_performance_monitor extension

Soon, fips will be using this extension internally, so the dispatch
layer needs this support to be able to resolve these functions
appropriately.

12 years agofips-dispatch: Simplify dispatch code by abstracting resolve functions
Carl Worth [Tue, 22 Oct 2013 17:41:16 +0000 (10:41 -0700)]
fips-dispatch: Simplify dispatch code by abstracting resolve functions

All of the resolve functions were structured identically, so rather
than repating the function bodies over and over, we can use a simple
"resolve" macro to implement this code. This gives a net reduction in
source code for better readability and maintainability.

12 years agoAdd xmalloc function
Carl Worth [Tue, 22 Oct 2013 17:26:22 +0000 (10:26 -0700)]
Add xmalloc function

To simplify the code by abstracting away repeated checks for malloc
failure and exit.

12 years agoRestore metrics op after temporarily changing for non-shader operation
Carl Worth [Wed, 16 Oct 2013 20:03:15 +0000 (13:03 -0700)]
Restore metrics op after temporarily changing for non-shader operation

This fixes the bug where an operation such as glClear would
incorrectly accrue all subsequent time until the next call to
glUseProgram would change the op away from glClear.

Now, each non-shader operation that changes the metrics operation
restores it to its previous value immediately afterward.

12 years agoAggregate non-shader GPU operations into their own operations
Carl Worth [Wed, 16 Oct 2013 03:23:08 +0000 (20:23 -0700)]
Aggregate non-shader GPU operations into their own operations

These operations are named after representative functions, (glClear,
glReadPixels, etc.). Aggregate time spent in any of these operations
is sorted together with the existing reports for time spent in
particular shader programs.

The shader program times should now be more accurate since time spent
in operations such as glClear will now no longer be accumulated into
the most recently-used shader.

12 years agoRework timer queries to run continuously.
Carl Worth [Tue, 15 Oct 2013 20:45:06 +0000 (13:45 -0700)]
Rework timer queries to run continuously.

Previously, we ran timer queries only around gl calls that we
determined were "drawing operations". This had the following
drawbacks:

1. Lots of timer queries, so more overhead than desired

2. Misses accumulating time from non "drawing operations"

3. Misses accumulating time from drawing operations we failed to
   identify.

Here, instead, we keep the timer running continuously, solving all
three of the above problems. We first start timer at make-current time
(glxMakeCurrent, glxMakeContextCurrent, or eglMakeCurrent), and only
stop it, (and immediately restart it), in one of the following
circumstances:

1. Current program changed (glUseProgram or glUseProgramObjectARB)

2. At each frame end (glxSwapBuffers or eglSwapBuffers)

12 years agoSimplify metrics interface by dropping metrics_counter_new
Carl Worth [Tue, 15 Oct 2013 20:20:33 +0000 (13:20 -0700)]
Simplify metrics interface by dropping metrics_counter_new

None of the callers of this function were doing anything with the
returned value other than passing it directly to
metrics_counter_start. So it's simpler to just fold the contents of
the metrics_counter_new function into the body of
metrics_counter_start itself.

12 years agometrics: Use a more meaningful field name.
Carl Worth [Mon, 7 Oct 2013 22:57:34 +0000 (15:57 -0700)]
metrics: Use a more meaningful field name.

I had "ticks" here before I knew the units of the timer-query
result. Since then, Eric dug up the documentation saying that this
timer reports time in nanoseconds. So use a field name of "time_ns"
rather than "ticks".

12 years agoTODO: Remove some completed tasks
Carl Worth [Mon, 7 Oct 2013 22:54:20 +0000 (15:54 -0700)]
TODO: Remove some completed tasks

Eric recently implemented sorted list of shaders in output as well as
better units for shader activity (milliseconds rather than "mega
ticks").

Meanwhile, I had previously fixed the bug with "undefined symbol:
glGenQueries" with the fips-dispatch code.

12 years agoSort the output and print the percentage.
Eric Anholt [Tue, 27 Aug 2013 18:59:45 +0000 (11:59 -0700)]
Sort the output and print the percentage.

12 years agoAdd an explanatory comment for a surprisingly-unused field.
Eric Anholt [Tue, 27 Aug 2013 18:49:58 +0000 (11:49 -0700)]
Add an explanatory comment for a surprisingly-unused field.

In the case we find programs that use non-genned shader program
numbers, we'll need to start actually using the field.

12 years agoReport what the actual units are.
Eric Anholt [Tue, 27 Aug 2013 18:43:40 +0000 (11:43 -0700)]
Report what the actual units are.

    "When the timer query timer is finally stopped, the elapsed time
     (in nanoseconds) is written to the corresponding query object as
     the query result value"

12 years agoAllow user to specify FIPS_LIBGL as path to "real" libGL.so library
Carl Worth [Mon, 7 Oct 2013 22:47:05 +0000 (15:47 -0700)]
Allow user to specify FIPS_LIBGL as path to "real" libGL.so library

This allows the user full control to cut through any heuristics fips
might use for trying to locate libGL.so on its own.

12 years agoconfigure: Fix generated comment for BINDIR_TO_LIBFIPSDIR
Carl Worth [Mon, 7 Oct 2013 22:39:12 +0000 (15:39 -0700)]
configure: Fix generated comment for BINDIR_TO_LIBFIPSDIR

The variable names were misspelled before, (incorrect case), so the
comment was being generated with empty values for the two variables,
(making it less than useful).

12 years agoMakefile: Don't install 32/64-bit target if not compiled
Carl Worth [Mon, 7 Oct 2013 22:33:52 +0000 (15:33 -0700)]
Makefile: Don't install 32/64-bit target if not compiled

We are already contionally compiling these, so the right answer is to
only conditionally install them as well.

12 years agoglxwrap: Initialize fips_dispatch when glxMakeContextCurrent is called
Carl Worth [Tue, 27 Aug 2013 20:14:53 +0000 (13:14 -0700)]
glxwrap: Initialize fips_dispatch when glxMakeContextCurrent is called

Previously, we only intitialized fips_dispatch if glxMakeCurrent was
called.  This caused fips to fail for programs that called
glxMakeContextCurrent instead. Both functions are now handled
indentically, (giving fips a clear indication that GLX is being used,
not EGL).

This fixes the failure of fips with Lightsmark 2008.

12 years agodlwrap: Add new dlwrap_dlopen_libfips function
Carl Worth [Mon, 5 Aug 2013 17:23:10 +0000 (10:23 -0700)]
dlwrap: Add new dlwrap_dlopen_libfips function

Previously, two different pieces of fips code (both for dlopen and for
glXGetProcAddress) both needed to dlopen the fips library
itself. However, the two pieces were implemented differently, (one
passed a symbol to dladdr to find a filename to dlopen, the other just
passed NULL to dlsym and hopef for the best).

Make things consistent by having a single, shared implementation in
the new function dlwrap_dlopen_libfips, (and implement it with the
more reliable approach of calling dladdr and then the real dlopen).

12 years agoMakefile: Drop rule for *.cc source files.
Carl Worth [Mon, 5 Aug 2013 17:19:36 +0000 (10:19 -0700)]
Makefile: Drop rule for *.cc source files.

Fips does not include any C++ source code, so it doesn't need this
rule to expand files matching the *.cc pattern.

12 years agoeglwrap: Fix some typos in a comment
Carl Worth [Wed, 3 Jul 2013 00:21:04 +0000 (17:21 -0700)]
eglwrap: Fix some typos in a comment

And drop the text about libGLESv2.so, (functions in libGLESv2 are
already taken care of in glwrap.c).

12 years agodlwrap: Add "libGLESv2.so" to the list of supported wrapped libraries
Carl Worth [Wed, 3 Jul 2013 00:38:28 +0000 (17:38 -0700)]
dlwrap: Add "libGLESv2.so" to the list of supported wrapped libraries

This hooks up libGLESv2 to all of our dlsym machinery. It ensures that
we can intercept any dlsym calls into libGLESv2. It also ensures that
when glwrap looks for underlying, "real", GL functions it will look
into libGLESv2.so if that's the library that the application has
previously dlopened.

This commit fixes the egl-glesv2-dlopen-dlsym and
egl-glesv2-dlopen-gpa tests in the test suite.

12 years agotest: Add 4 tests using EGL and OpenGLESv2
Carl Worth [Tue, 2 Jul 2013 20:07:40 +0000 (13:07 -0700)]
test: Add 4 tests using EGL and OpenGLESv2

These are similar variants to the four existing tests using EGL and OpenGL.

To add these tests we add a new configure-time check to find the
compilation flags for GLESv2. We also drop the set_2d_projection code
which was using glLoadIdentity, glMatrixMode, and glOrtho functions
which apparently don't exist in GLESv2. So common.s and all tests with
custom wrappers are modified to drop these calls.

As with the egl-opengl tests, all new tests except for the dlsym-based
test pass. That's not too surprising since there are so many twisty
paths in trying to get all the dlopen/dlsym stuff to work correctly.

And hurrah for test suites finding bugs!

12 years agoglwrap: Don't hardcode "libGL.so.1" for looking up real OpenGL symbols
Carl Worth [Wed, 3 Jul 2013 00:33:12 +0000 (17:33 -0700)]
glwrap: Don't hardcode "libGL.so.1" for looking up real OpenGL symbols

As preparation for testing using GLESv2 we need to ensure that our GL
wrappers are prepared for an OpenGL implementation in either the
libGL.so.1 library or in libGLESv2.so.2.

When the application is directly linked to an OpenGL implementation,
we don't care about the name at all. In this case, we can simply call
dlsym with RTLD_NEXT to find the real, underlying OpenGL symbols.

But when an application uses dlopen to load the OpenGL library, we
want to carefully call dlsym with a handle for the same library that
the application uses. Previously, the glwrap code was unconditionally
calling dlopen for "libGL.so" and that's not what we want.

Instead, we now have our dlopen wrapper watch for any dlopen of a
library whose name begins with "libGL" and then stashing the returned
handle via a new glwrap_set_gl_handle call. The stashed handle will
then be used by dlsym calls within glwrap.

12 years agoconfigure: Drop broken workarounds for missing pkg-config
Carl Worth [Tue, 2 Jul 2013 19:45:18 +0000 (12:45 -0700)]
configure: Drop broken workarounds for missing pkg-config

Any reasonably-modern system should have versions of things like OpenGL
libraries installed with pkg-config libraries.

Regardless, the checks we had in place here for missing gl.pc files
were untested and obviously not very useful, (they didn't actually
look around anywhere for GL headers nor for GL libraries).

We're better off not even pretending to be able to find things without
pkg-config.

12 years agofips: Fix dlsym wrapper for egl symbols
Carl Worth [Tue, 2 Jul 2013 19:28:03 +0000 (12:28 -0700)]
fips: Fix dlsym wrapper for egl symbols

Previously, fips was failing to provide its own wrapped versions for
functions such as eglMakeCurrent if the application was using dlsym to
locate the symbol. This led to the failure of the egl-opengl-dlopen-*
tests in the test suite.

The root of the problem was that the fips wrapper for dlopen was only
returning the libfips_handle if dlopen was requested for
"libGL.so". But here, we need to also intercept a dlopen for
"libEGL.so" as well.

However, the fix is not as simple as updating dlopen.

Previously, if dlsym failed to find a libfips-specific version of the
symbol of interest it would defer unconditionally to a call to the
real dlsym with a handle dlopened from "libGL.so". That's obviously
the wrong thing for symbols sougth from "libEGL.so". So, now, our
dlopen caches the originally dlopen'ed handles and encodes an index
into its return value so that the final dlsym can reference the
correct handle in order to find its symbol.

This commit fixes the egl-opengl-dlopen-dlsym and
egl-opengl-dlopen-gpa test cases.

12 years agotest: Add remaining three egl-opengl tests
Carl Worth [Tue, 2 Jul 2013 18:53:52 +0000 (11:53 -0700)]
test: Add remaining three egl-opengl tests

In a previous commit message, I had suggested we would be adding five
additional tests here. But unlike GLX, EGL provides only
eglGetProcAddress, (and no eglGetProcAddressARB), so two of the GLX
variants don't apply.

The two dlopen-based tests are currently failing when run under fips,
so once again the test suite has come through and found another bug.

12 years agotest: Add support for EGL-based test, (and one EGL-based test)
Carl Worth [Tue, 2 Jul 2013 00:44:14 +0000 (17:44 -0700)]
test: Add support for EGL-based test, (and one EGL-based test)

For this, common.c now supports a new macro COMMON_USE_EGL which can
optionally be defined by the test before including common.c.

Some aspects of the common.c interface have changed slightly, (the
create_context call is now either create_glx_context or
create_egl_context, and the caller must explicitly call the new
common_make_current call).

This commit adds a single egl-based test, (egl-opengl-link-call),
which is similar to the existing gl-link-call test. This is basically
to ensure that the new code in common.c is functional.

We plan to follow up with egl-opengl variants for the remaining 5
existing gl tests, (and then egl-glesv2 variants for all 6 as well).

12 years agotest: Rename handle-events.c to common.c
Carl Worth [Mon, 1 Jul 2013 18:29:40 +0000 (11:29 -0700)]
test: Rename handle-events.c to common.c

Previously, this C file defined one function
(handle_events). Recently, it acquired a second function
(create_context).

In order to provide a common namespace, these functions are here
renamed to:

common_handle_events
and
common_create_context

so the filename is renamed to match.

Similarly, the HANDLE_EVENTS_GL_PREFIX macro is also renamed to
COMMON_GL_PREFIX.

12 years agoutil-x11: Rework init_window interface to accept XVisualInfo
Carl Worth [Mon, 1 Jul 2013 18:22:17 +0000 (11:22 -0700)]
util-x11: Rework init_window interface to accept XVisualInfo

This is a much more correct way of doing things. Previously, we would select
a visual when creating the OpenGL context, but then use a default visual when
creating a window. This was fragile and would fail if the default visual was
not identical to what we had created.

Now, instead, we pass the selected XVisualInfo to our init_window interface
and call XCreateWindow instead of XCreateSimpleWindow. This guarantees that
the visuals match as required.

12 years agotest: Rename util.c and util.h to util-x11.c and util-x11.h
Carl Worth [Mon, 1 Jul 2013 17:43:50 +0000 (10:43 -0700)]
test: Rename util.c and util.h to util-x11.c and util-x11.h

These utility functions are all specific to the libX11 interface already,
and since we're planning to add some other utility functions soon, (such
as EGL), it will help to not have a too-generic name already used.

While doing this, also split up the interfaces for Display and Window
creation. This will allow us to create the GL context in between to
guarantee that the Window is created with the same visual as the GL
context.

12 years agotest: Add two more tests to the test suite
Carl Worth [Fri, 28 Jun 2013 17:55:59 +0000 (10:55 -0700)]
test: Add two more tests to the test suite

These link directly against libGL, but then use glXGetProcAddress or
glXGetProcAddressARB to locate OpenGL function symbols.

12 years agotest: Reduce code duplication in test-suite programs
Carl Worth [Thu, 27 Jun 2013 22:20:45 +0000 (15:20 -0700)]
test: Reduce code duplication in test-suite programs

All of the test suite programs previously had their own copies of
common drawing code. Now, this code is put into a shared
handle-events.c. Each test program includes handle-events and can
provide its own prefix for called OpenGL functions by first defining
HANDLE_EVENTS_GL_PREFIX.

12 years agoglxwraps: Fix fips for programs that call glXGetProcAddress
Carl Worth [Thu, 27 Jun 2013 21:40:17 +0000 (14:40 -0700)]
glxwraps: Fix fips for programs that call glXGetProcAddress

Previously, fips would work for programs calling glXGetProcAddressARB
but not for programs calling glXGetProcAddress.

Thanks to the recently-added test suite for noticing this bug.

12 years agotest: Add two more tests, (now using glXGetProcAddress instead of dlsym)
Carl Worth [Thu, 27 Jun 2013 21:34:21 +0000 (14:34 -0700)]
test: Add two more tests, (now using glXGetProcAddress instead of dlsym)

One test calls glXGetProcAddress the other calls glXGetProcAddressARB.

And noticeably, the test with glXGetProcAddress fails, so the test
suite has found its first bug.

12 years agotest: Add test using GLX with dlopen and dlsym to find symbols
Carl Worth [Thu, 27 Jun 2013 21:08:39 +0000 (14:08 -0700)]
test: Add test using GLX with dlopen and dlsym to find symbols

Gradually building out the test suite to something useful here.

12 years agofips: Add the beginning of a test suite
Carl Worth [Thu, 27 Jun 2013 20:26:59 +0000 (13:26 -0700)]
fips: Add the beginning of a test suite

So far, there's just one test program. It links against libGL.so and
uses GLX to render a few solid frames. The test suite ensures that it
can be run and that "fips --verbose" actually prints a message.

12 years agofips: Add a -v/--verbose flag.
Carl Worth [Thu, 27 Jun 2013 20:23:55 +0000 (13:23 -0700)]
fips: Add a -v/--verbose flag.

The only real purpose imagined for this for now is to be able to
verify that fips is actually doing something, (for example, if a
program renders less than 60 frames and exits then previous fips would
exit silently).

The --verbose flag will be useful with the upcoming test suite and its
short-lived programs.

12 years agoconfigure: Add pkg-config-based check for libX11
Carl Worth [Thu, 27 Jun 2013 20:22:54 +0000 (13:22 -0700)]
configure: Add pkg-config-based check for libX11

Nothing in fips itself needs to link against libX11, but we'll soon be
adding a test-suite program that needs to be able to.

12 years agoconfigure: Set GL_LDFLAGS and EGL_LDFLAGS in configure script
Carl Worth [Thu, 27 Jun 2013 03:46:40 +0000 (20:46 -0700)]
configure: Set GL_LDFLAGS and EGL_LDFLAGS in configure script

The libfips library doesn't link directly to libGL nor libEGL so
didn't need these flags. But we're adding test programs that do link
to these, so the test's Makefile needs access to these flags.

12 years agoPush final collection of CFLAGS/LDFLAGS from Makefile.config to Makefile.local
Carl Worth [Thu, 27 Jun 2013 01:18:52 +0000 (18:18 -0700)]
Push final collection of CFLAGS/LDFLAGS from Makefile.config to Makefile.local

This makes the final decision more explicit closer to where the flags
are actually being used. This will be helpful as we add other
programs, which can now easily mimic the style of flags collection as
is done for fips.

This also eliminates any potential confusion of FIPS_FLAGS
vs. FINAL_FIPS_FLAGS, etc. The use of "FINAL_" has now been entirely
eliminated.

12 years agoStop processing command-line options at first non-option argument
Carl Worth [Tue, 25 Jun 2013 23:48:13 +0000 (16:48 -0700)]
Stop processing command-line options at first non-option argument

This makes it much easier to pass options to the program being
executed by fips. The options can be passed directly, such as:

fips glxgears -fullscreen

Previous, to this commit, one would have to use a syntax such as:

fips -- glxgears -fullscreen

to prevent fips from trying to interpret the "-fullscreen" argument as
options to fips itself.

12 years agoeglwrap: Add comment describing why we don't lookup into libGLESv2.so
Carl Worth [Mon, 24 Jun 2013 22:49:44 +0000 (15:49 -0700)]
eglwrap: Add comment describing why we don't lookup into libGLESv2.so

A user recently asked me why we didn't perform lookups in
libGLESv2.so, (instead of just libEGL.so). I actually made the mistake
of writing code to do that before I realized the answer.

Adding the answer in a comment here should help me avoid making that
mistake again.

12 years agoEGL: Add wrapper for eglGetProcAddress
Carl Worth [Mon, 24 Jun 2013 22:44:47 +0000 (15:44 -0700)]
EGL: Add wrapper for eglGetProcAddress

If an EGL-using program uses eglGetProcAddress to locate functions, we
want to intercept that to return our own versions of the functions,
(to add out metrics timings, etc.).

If the requested function is not implemented in our library, just
defer to the real, underlying eglGetProcAddress function to find the
symbol.

12 years agoconfigure: Fix configure check to look for egl.h in the correct directory
Carl Worth [Mon, 24 Jun 2013 22:27:50 +0000 (15:27 -0700)]
configure: Fix configure check to look for egl.h in the correct directory

This configure check was broken by looking for GL/egl.h instead of
EGL/egl.h as it should. This failure was masked on any system with an
EGL implementation providing a pkg-config file (egl.pc).

12 years agoPush glBeginQuery/glEndQuery down into metrics.c
Carl Worth [Mon, 24 Jun 2013 22:24:20 +0000 (22:24 +0000)]
Push glBeginQuery/glEndQuery down into metrics.c

The code in metrics.c was already using dynamic dispatch for OpenGL functions.

But the code in glwrap is now, (and cannot since it relies on "real" OpenGL
header files to ensure the wrapped functions have the correct prototypes).

This resulted in link failures since these functions were not called via
dynamic dispatch.

Gix by adding new metrics_counter_start and metrics_counter_stop functions which
call the glBeginQuery/glEndQuery functions via dynamic dispatch.

12 years agofips-dispatch: Completely separate fips-dispatch GL prototypes from GL/gl.h
Carl Worth [Mon, 24 Jun 2013 20:22:59 +0000 (13:22 -0700)]
fips-dispatch: Completely separate fips-dispatch GL prototypes from GL/gl.h

Move the OpenGL prototypes previously in fips-dispatch.h to a new
fips-dispatch-gl.h. The idea here is that any given file should
include only one of GL/gl.h or fips-dispatch-gl.h.

Files that implement libfips wrappers for OpenGL functions include
GL/gl.h to ensure that they implement functions with the correct
prototypes.

Meanwhile, files that call into OpenGL functions at run-time, (such as
metrics.c which calls the various OpenGL query-related functions),
instead include fips-dispatch-gl.h and do not include GL/gl.h. With
this approach, any new calls to OpenGL functions will cause
compilation warnings if the stubs are not also added to
fips-dispatch-gl.h.

12 years agoAdd dynamic dispatch for any calls to OpenGL functions.
Carl Worth [Sat, 22 Jun 2013 00:10:03 +0000 (17:10 -0700)]
Add dynamic dispatch for any calls to OpenGL functions.

Previously, fips code was making direct calls to OpenGL functions,
(such as glGenQueries, glBeinQuery, etc. within metrics.c). Some
OpenGL implementations do not export these symbols directly,
(expecting the application to instead look the symbols up via a call
to glXGetProcAddressARB or eglGetProcAddress).

The new fips-dispatch code added here does precisely that, (and adds
wrapper for both glXMakeCurrent and eglMakeCurrent in order to know
which GetProcAddress function should be called).

The dispatch code follows the model of piglit-dispatch, (available
under the same license as fips). Thanks to Eric Anholt for suggesting
following the same approach as piglit.

12 years agoconfigure: Fix to have compiler warnings enabled while building libfips
Carl Worth [Mon, 24 Jun 2013 20:19:41 +0000 (13:19 -0700)]
configure: Fix to have compiler warnings enabled while building libfips

In commit e42d9f224a4ef2784f8fd43f9f4f5c593a7ddd57 , when the flags
were split between fips and libfips, the warnings flags were
mistakenly applied to both CFLAGS and LDFLAGS of fips. (What was
actually intended was to have the warnings applied to the CFLAGS of
both fips and libfips).

12 years agoTODO: Add some additional items suggested by Eero.
Carl Worth [Fri, 14 Jun 2013 18:29:33 +0000 (11:29 -0700)]
TODO: Add some additional items suggested by Eero.

Again, simply trying to ensure that good ideas that come in via email
don't get dropped on the floor.

 Report shader compilation time.

+Report elapsed time per frame.
+
+Add options to control which metrics should be collected.
+
 Add Eric's tiny hash table for collecting per-shader statistics

  people.freedesktop.org:~anholt/hash_table
@@ -45,6 +49,9 @@ Infrastructure (larger-scale things, more future-looking items)

 Use ncurses for a better top-like display.

+Report timestamps and CPU time durations for operations causing
+CPU/GPU syncs.
+
 Emit per-frame data in a format for external timeline viewer.

 Allow enabling/disabling of tracing at run-time
@@ -61,10 +68,16 @@ should automatically collect:

 Audit exisiting visualization tools before writing one from scratch

- Eero suggested that pytimechart might be well-suited:
+ Eero suggested two possibilities:

+ pytimechart
+ -----------
  http://pythonhosted.org/pytimechart/index.html

+ e-graph
+ -------
+ https://gitorious.org/e-graph
+
  Others?

 Explore using perf/LTTng probing instead of LD_PRELOAD wrapper

12 years agoTODO: Remove bug causing libfips-32.so to not build.
Carl Worth [Fri, 14 Jun 2013 18:11:42 +0000 (11:11 -0700)]
TODO: Remove bug causing libfips-32.so to not build.

The configure script now checks for this problem and won't attempt to
build a non-native-arch libfips if the toolchain pieces, (such as the
gcc-multilib package), are not in place.

12 years agoconfigure: Fully separate CFLAGS/LDFLAGS between fips and libfips
Carl Worth [Fri, 14 Jun 2013 06:29:07 +0000 (23:29 -0700)]
configure: Fully separate CFLAGS/LDFLAGS between fips and libfips

The top-level program and the underlying library have fundamentally
different requirements. For example, the top-level program needs to
link against libtalloc and libelf but the library does not.

Previously, the necessary flags for both were mixed together in
CONFIGURE_CFLAGS and CONFIGURE_LDFLAGS. This caused the library to
unnecessarily link against libtalloc and libelf, (which in turn caused
problems since the library is compiled as both 32-bit and 64-bit but
the system may not provide both 32- and 64-bit versions of these
libraries).

By splitting things up into separate FIPS_LDFLAGS vs. LIBFIPS_LDFLAGS,
etc. we can keep the dependencies down to what is really required and
eliminate several sprious failure cases.

12 years agoAdd more detailed warning if libfips binary could not be found.
Carl Worth [Fri, 14 Jun 2013 05:02:45 +0000 (22:02 -0700)]
Add more detailed warning if libfips binary could not be found.

Since we now may not compile a non-native bit-size libfips, (such as
not compiling libfips-32.so on a native 64-bit install), then fips can
fail when trying to wrap a 32-bit application.

So be kind and suggest that the user install gcc-multilib and
re-compile fips as one potential solution for this problem.

12 years agoconfigure: Test whether compiler can create both 32 and 64-bit binaries
Carl Worth [Fri, 14 Jun 2013 04:57:38 +0000 (21:57 -0700)]
configure: Test whether compiler can create both 32 and 64-bit binaries

If not, tell the user and recommend installing gcc-multilib. Then simply
don't attempt to compile the unspoorted library.

12 years agoconfigure: Move the code which detects compiler warning options
Carl Worth [Thu, 13 Jun 2013 22:39:30 +0000 (15:39 -0700)]
configure: Move the code which detects compiler warning options

For no good reason, this code was previously stuck right in the middle
of code reporting the final results of previous checks, (after the
case reporting that errors were found and before the case reporting
that no errors were found).

It's more clean to have the warning-option detection happen before any
of that reporting.

12 years agoconfigure: Switch from 4 spaces to tabs for some messages
Carl Worth [Thu, 13 Jun 2013 22:33:26 +0000 (15:33 -0700)]
configure: Switch from 4 spaces to tabs for some messages

Another cosmetic improvement to simply align the output more cleanly.

12 years agoconfigure: Add an early check for a functional C compiler
Carl Worth [Thu, 13 Jun 2013 22:00:49 +0000 (15:00 -0700)]
configure: Add an early check for a functional C compiler

Without this, later compiler-based checks for header files, etc. would
falsely claim that libraries were not installed, (when in fact, the
libraries were installed but the compiler-based checks were failing
because no compiler is available).

12 years agoconfigure: Tighten up the text on a couple of messages
Carl Worth [Thu, 13 Jun 2013 21:32:32 +0000 (14:32 -0700)]
configure: Tighten up the text on a couple of messages

Just a cosmetic thing to make the column of Yes/No messages align more
closely.

12 years agoconfigure: Move the error message for pkg-config earlier
Carl Worth [Thu, 13 Jun 2013 21:26:08 +0000 (14:26 -0700)]
configure: Move the error message for pkg-config earlier

Once pkg-config cannot be found, there's no point in running the rest
of the configure script since it will just spew a bunch of errors due
to missing pkg-config.

So, stop early and let the user know that pkg-config needs to be
installed.

12 years agoAdd a TODO file
Carl Worth [Thu, 13 Jun 2013 17:37:36 +0000 (10:37 -0700)]
Add a TODO file

This captures known bugs, planned (near-term) features, planned
(longer-term) infrastructure changes, and some ideas for other things
to investigate.

Many thanks to Eero Tamminen whose recent discussions and ideas
prompted the creation of this file, (and much of the content).

12 years agoeglwrap: Add EGLWRAP_DEFER and EGLWRAP_DEFER_WITH_RETURN macros
Carl Worth [Wed, 12 Jun 2013 23:35:59 +0000 (16:35 -0700)]
eglwrap: Add EGLWRAP_DEFER and EGLWRAP_DEFER_WITH_RETURN macros

There are parallel to GLWRAP_DEFER and GLWRAP_DEFER_WITH_RETURN, (differing
only in calling eglwrap_lookup rathern than glwrap_lookup).

Having these macros around will avoid some code duplication as we start
adding more functions to the eglwrap.c file.

12 years agoFix to actually load the real libGL.so when the application asks for it.
Carl Worth [Wed, 12 Jun 2013 23:22:06 +0000 (16:22 -0700)]
Fix to actually load the real libGL.so when the application asks for it.

Our wrapper library intercepts calls to dlopen "libGL.so" and returns
a handle to itself. That's correct, and as intended.

Before doing this, however, it's essential to actual dlopen "libGL.so"
for real even though we won't be returning a handle to it. This
ensures that any side effects from that dlopen are taken care of.

This fixes a bug where "fips apitrace replay foo.trace" would cause
Mesa to fail to load its driver as follows (with LIBGL_DEBUG=verbose):

libGL: OpenDriver: trying .../lib/dri/i965_dri.so
libGL error: dlopen .../lib/dri/i965_dri.so failed (.../lib/libdricore9.2.0.so.1: undefined symbol: _glapi_tls_Context)

12 years agodlwrap: Don't resolve libfips_handle on every call to dlopen.
Carl Worth [Wed, 12 Jun 2013 23:16:51 +0000 (16:16 -0700)]
dlwrap: Don't resolve libfips_handle on every call to dlopen.

Instead, call dladdr and the real dlopen on the first call to dlopen
then save the libfips_handle result for all future calls.

12 years agoSwitch from glGetQueryObjectiv to glGetQueryObjectuiv
Carl Worth [Wed, 12 Jun 2013 00:18:12 +0000 (17:18 -0700)]
Switch from glGetQueryObjectiv to glGetQueryObjectuiv

The latter is available in OpenGL ES 3 while the former is not.

We don't really care about the signedness either way, (we're fetching
a Boolean), so sticking consistently to the unsigned version provides
better portability with no downside.

12 years agoAdd a new GLWRAP_DEFER_WITH_RETURN macro.
Carl Worth [Mon, 10 Jun 2013 21:40:43 +0000 (14:40 -0700)]
Add a new GLWRAP_DEFER_WITH_RETURN macro.

This allows for the elimination of some code duplication from our
implementation of glXGetPrcAddressARB. The previous implementation
duplicated code from glwrap_lookup simply because the GLWRAP_DEFER
macro did not provide access to the return value of the wrapped
function.

With the new macro, (very much like GLWRAP_DEFER but accepting a
parameter for a variable to accept the return value), we can eliminate
this code duplication.

Of course, our symbol-extraction script is now a bit more complicated
since it has to find occurrences of DEFER_WITH_RETURN in addition to
occurrences of DEFER, and pull out the function name as the second
argument rather than the first.

12 years agoRemove typedef for fips_glXGetProcAddressARB_t
Carl Worth [Mon, 10 Jun 2013 21:34:26 +0000 (14:34 -0700)]
Remove typedef for fips_glXGetProcAddressARB_t

There were two problems with this typedef. First, we don't actually
need it, (we define it here and then use it exactly once on the next
line---it's simpler to have the direct syntax for a function returning
a pointer to a function accepting void and returning void.

More importantly, the typedef was relying on the type __GLXextFuncPtr
being defined. This happens to work with Mesa on my system but is
inherently fragile. So the code is more robust not relying on this.

12 years agoMakefile: Automatically generate libfips.sym symbol map
Carl Worth [Thu, 30 May 2013 22:10:15 +0000 (15:10 -0700)]
Makefile: Automatically generate libfips.sym symbol map

Previously, we had to manually maintain this table of symbols, (hence
it was too easy for the list to be stale). Instead, we now generate
the list automatically by examining the source code for symbols that
are wrapped.

12 years agolibfips.sym: Sort list in symbol map alphabetically.
Carl Worth [Thu, 30 May 2013 21:49:18 +0000 (14:49 -0700)]
libfips.sym: Sort list in symbol map alphabetically.

Where sort order is determined by "sort" utility.

This is to prepare for eventually generating this list automatically
from the source.

12 years agoAdd some *wrap_ prefixes to real_foo symbols.
Carl Worth [Thu, 30 May 2013 21:32:52 +0000 (14:32 -0700)]
Add some *wrap_ prefixes to real_foo symbols.

The intent here is to allow automated extraction of wrapper names by
grepping for symbols matching *wrap_real_<wrapper>.

12 years agoAdd two missing GL draw wrappers
Carl Worth [Thu, 30 May 2013 21:22:24 +0000 (14:22 -0700)]
Add two missing GL draw wrappers

The following two functions are now added:

glMultiDrawArraysIndirect
glMultiDrawElementsIndirect

These were previously commented out with a "FIXME" comment. I don't
recall now what original problem I ran into when trying to add these,
but they seem to work fine now.

12 years agometrics: Collect new timer-query results before report
Carl Worth [Thu, 30 May 2013 21:05:08 +0000 (14:05 -0700)]
metrics: Collect new timer-query results before report

The timers from the most-recently-completed frame may not yet be
complete, but still, for the most accurate reports, we now collect all
available timer values before printing the report.

12 years agodlwrap: Fix dlwrap_real_dlopen to only perform dlsym-lookup once
Carl Worth [Thu, 30 May 2013 19:55:26 +0000 (12:55 -0700)]
dlwrap: Fix dlwrap_real_dlopen to only perform dlsym-lookup once

Making the real_dlopen variable static means that we perform the dlysm
lookup only once and then re-use the result for later calls. This is
what was always intended for this code.

12 years agoAvoid inserting timer queries while constructing a display list
Carl Worth [Fri, 24 May 2013 18:11:15 +0000 (11:11 -0700)]
Avoid inserting timer queries while constructing a display list

We only want to time actual drawing operations. When between glNewList
and glEndList, calls that look like drawing operations are not really,
instead these are just calls that are being recorded to be later
executed with glCallList. (And it won't work to put our timer queries
inside the display list.)

So, track when we are within glNewList/glEndList and don't add timer
queries.  Instead, we will time these operations as a whole with a
timer query around the glCallList call itself.